当前位置:
首页 > temp > python入门教程 >
-
Python数据分析项目讲解:分析世界五百强企业数据
导入数据
data = pd.read_excel('2021年世界五百强排行榜.xlsx') data.head(5)
统计世界500强企业各个国家之间的占比
pie = Pie(init_opts=opts.InitOpts(theme='light', width='800px', height='700px')) data_x = data1['国家'].tolist() data_y = data1['排名'].tolist() pie.add("", [list(z) for z in zip(data_x, data_y)], radius=["35%", "55%"] ) pie.set_series_opts(label_opts=opts.LabelOpts(position="insideLeft", font_size=12, color='rgba(0,0,0,0.5)', font_weight='bold', formatter='{b}:{d}%'), itemstyle_opts={'normal': { 'opacity': 1, # 透明度 'shadowColor': 'rgba(0, 0, 0, 0.2)', # 阴影颜色 'shadowBlur': 5, # 阴影大小 'shadowOffsetY': 5, # Y轴方向阴影偏移 'shadowOffsetX': 5, # x轴方向阴影偏移 } } ) pie.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_left='right', pos_top='center', orient='vertical'), title_opts=opts.TitleOpts(title="2021年世界各国500强企业占比", pos_top='center', pos_left='center', title_textstyle_opts=opts.TextStyleOpts(font_size=16)), visualmap_opts=opts.VisualMapOpts( min_=0, max_=200, )) pie.render_notebook()
将国家列设置为索引
bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION)) bar.add_yaxis("世界500强企业数量", data1['排名'].tolist()) bar.set_global_opts(title_opts=opts.TitleOpts(title="每日电量统计表"),toolbox_opts=opts.ToolboxOpts(),xaxis_opts=opts.AxisOpts(name_rotate=60,axislabel_opts={"rotate":45})) bar.render_notebook() # 绘制直方图来显示 # 线性渐变 color_js = """new echarts.graphic.LinearGradient(0, 1, 0, 0, [{offset: 0, color: '#008B8B'}, {offset: 1, color: '#FF6347'}], false)""" bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK)) bar.add_xaxis(data1.index.tolist()) bar.add_yaxis("世界500强企业数量", data1['排名'].tolist(),itemstyle_opts=opts.ItemStyleOpts(color=JsCode(color_js))) bar.set_global_opts(title_opts=opts.TitleOpts(title="2021年各国世界500强企业统计",subtitle='',pos_left='center',pos_top='3%'), toolbox_opts=opts.ToolboxOpts(), xaxis_opts=opts.AxisOpts(name_rotate=60,axislabel_opts={"rotate":45}), legend_opts=opts.LegendOpts(is_show=True, pos_left='80%', pos_bottom='90%')) bar.render_notebook()
筛选出中国的世界500强企业并进行数据可视化分析
# m_df = df.groupby(['行业'])['存活天数'].mean().reset_index() data2.sort_values(by='排名',ascending=False, inplace=True) data_x = data2['字段2'].tolist() data_y = data2['排名'].tolist() bar = Bar(init_opts=opts.InitOpts(theme='light', width='1000px', height='900px')) bar.add_xaxis(data_x) bar.add_yaxis('平均存活天数', [int(i) for i in data_y]) bar.set_series_opts(label_opts=opts.LabelOpts(position="insideLeft", font_size=12, font_weight='bold', formatter='{b}:{c}')) bar.set_global_opts(title_opts=opts.TitleOpts(title="2021年中国世界500强企业城市分布", pos_top='2%', pos_left='center', title_textstyle_opts=opts.TextStyleOpts(font_size=16)), legend_opts=opts.LegendOpts(is_show=False), xaxis_opts=opts.AxisOpts(is_show=False, is_scale=True), yaxis_opts=opts.AxisOpts(is_show=False), visualmap_opts=opts.VisualMapOpts( max_=3000, min_=1500, is_piecewise=False, dimension=0, range_color=['rgba(238,25,38,1)', 'rgba(289,112,147,0.4)']) ) bar.reversal_axis() bar.render_notebook()
出处:https://www.cnblogs.com/qshhl/p/15139436.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数