当前位置:
首页 > temp > 简明python教程 >
-
Python数据分析之双色球高频数据统计
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
Step1:基础数据准备(通过爬虫获取到),以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下 :
备注:想要现成数据的可以给我发邮件哟~
Step2: 分析数据特征和数据处理方式选择,直接上代码如下:
#导入Counter from collections import Counter def readfile(): red_lists=[] blue_lists=[] #打开文件并获取文件句柄 with open("./balls.txt", "r",encoding='utf-8') as fp: #开始读取文件并返回一个list list1=fp.readlines() #遍历整个文件内容 for i in range(len(list1)): #替换掉\n的字符再按空格分隔 list2=str(list1[i]).replace("\n","").split(" ") for j in range(len(list2)): if j==6: #蓝球放入到blue_lists 列表中 blue_lists.append(list2[j]) else: #红球放入到red_lists 列表中 red_lists.append(list2[j]) #Counter可以快速便捷的对某些对象做一些统计操作,这里是对列表里面的数据进行出现次数统计,返回一个tuple red_count=Counter(red_lists) blue_count=Counter(blue_lists) #most_common可以用来统计列表或字符串中最常出现的元素并做排序,并返回一个list k = red_count.most_common(len(red_count)) #输出出现频率最高的六个红球 print("the red ball:",k[:6]) l = blue_count.most_common(len(blue_count)) #输出出现频率最高的六个蓝球 print("the blue ball:",l[:6]) if __name__=="__main__": readfile()
Step3:执行结果如下:
Step4:执行结果验证:
从官网获取的数据进行对比,一致性校验通过。
总结:python在数据处理方面有着非常强大的优势,其实早先用过Panda库也可以非常出色的完成双色球的数据统计,大家有兴趣的可以实验一下。
加企鹅群695185429即可免费获取,资料全在群文件里。资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数