当前位置:
首页 > Python基础教程 >
-
python基础教程之Python基础:字典(dict)与集合(set)
字典与集合之所以高效的原因是:内部结构都是一张哈希表。
平均情况下插入、查找和删除的时间复杂度为 O(1).
查找场景下与列表的性能对比
假设有数量100,000的产品列表:
import time id = [x for x in range(0, 100000)] price = [x for x in range(200000, 300000)] products = list(zip(id, price)) #products # [(0, 200000), (1, 200001)....(99999, 299999)]
要统计出总共有多少种不同的价格,分别用列表list与集合set来作为存储的数据结构,来对比下性能。
用列表作为数据结构:
# # 计算列表版本的时间 # list version def find_unique_price_using_list(products): unique_price_list = [] for _, price in products: # A if price not in unique_price_list: #B unique_price_list.append(price) return len(unique_price_list) start_using_list = time.perf_counter() find_unique_price_using_list(products) end_using_list = time.perf_counter() print("time elapse using list: {}".format(end_using_list - start_using_list)) #time elapse using list: 53.206719899999996
用集合作为数据结构:
# # 计算集合版本的时间 # set version def find_unique_price_using_set(products): unique_price_set = set() for _, price in products: unique_price_set.add(price) return len(unique_price_set) start_using_set = time.perf_counter() find_unique_price_using_set(products) end_using_set = time.perf_counter() print("time elapse using set: {}".format(end_using_set - start_using_set)) #time elapse using set: 0.009022799999996778
从结果可以看出,性能差异非常大,使用合适的数据结构非常重要。
Dict与Set基础
- 集合不支持索引操作
- 判断元素是否在dict/set中用 in 操作符
dict1 = {'a':1,'b':2} print('a' in dict1) #True print(1 in dict1) #False set1 = {'a','b','c'} print(1 in set1) #False print('b' in set1) #True
3.集合的pop()方法是随机返回一个元素,并把集合中的该元素删除
4.集合与字典的排序
#字典排序 d = {'b': 1, 'a': 2, 'c': 10} d_sorted_by_key = sorted(d.items(), key=lambda x: x[0]) # 根据字典键的升序排序 d_sorted_by_value = sorted(d.items(), key=lambda x: x[1]) # 根据字典值的升序排序 d_sorted_by_key [('a', 2), ('b', 1), ('c', 10)] d_sorted_by_value [('b', 1), ('a', 2), ('c', 10)] #集合排序 s = {3, 4, 2, 1} sorted(s) # 对集合的元素进行升序排序 [1, 2, 3, 4]
参考资料:
极客时间《Python核心技术与实战》专栏
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式