首页 > Python基础教程 >
-
为什么QQ能帮你找到失散多年的兄弟?----图论
来源:萝卜大杂烩
作者:周萝卜
偶然之间,发现了一个网站,title 是世界银行,很高级的样子,可以下载很多有趣的数据,这对于我们练手数据分析及可视化真的是太好的资源了,不多说,戳下面的链接可以火箭直达哦!
https://data.worldbank.org/
我从该网站上下载了世界各国历年的 GDP 总值和增长率数据,下面就摩拳擦掌,一探 GDP 的世界!
数据文件分析
先来看下我们拿到的文件,都有什么数据,哪些是我们可以利用起来的。
GDP 总量数据,这是我们研究的重点数据文件,里面囊括了世界各个国家和地区的历史 GDP 数据,我把它命名为“GDP_data.csv”。

GDP 增长率数据,这个同样是非常重要的数据文件,记录了各国 GDP 的增长率情况,我把它命名为“growth_data.csv”。

国家收入分类数据,该数据文件把各个国家分类成不同等级的收入阶层,比如有“高收入国家”,“低收入国家”等等,我把它命名为“Country_data.csv”。

国家 Code 对照表,这是一个国家英文名称和 Country Code 的对照表,我们后面在绘制地图时会使用到。

各个收入等级分析
各个收入等级分布
首先我们先来看下世界各国分布在不同收入等级的情况

可以看到,处于“高等收入”和“低收入”的国家比例差距还是很大的,在二十一世纪的今天,还有太多的人过着食不果腹、衣不保暖的生活。
下面我们再具体看下不同收入等级中各个国家具体的 GDP 总量
高收入国家
首先是高收入国家 top10 的 GDP 总量
我们首先拿到高等收入的国家信息,再与 gdp 信息数据合并,最后得到 top10 数据
# 高收入国家2018年的GDP
high = country_data[country_data['Income_Group'] == '高收入国家']
high_gdp = pd.merge(high, gdp, how='inner')
high_gdp['2018'] = high_gdp['2018'].apply(lambda x: x/1000000000000)
high_gdp_top10 = high_gdp[['Country Name', 'Country Code', '2018']].sort_values(by='2018', ascending=False)[:10]

可以看到,美国是一骑绝尘,排在后面的小弟们,总量加一起也没法和美国相提并论。而在前十名当中,几乎清一色的欧美发达国家。
我们再把榜单扩展到 top20,能看到,欧洲国家还是居多的,而中东的两个土豪也成功上榜了。

最后再来看下美国占据全世界 GDP 总量的百分比情况
看图不说话。
中等收入国家
接下来看看中等收入国家的 top10 情况

基本上都是发展中大国,其中还不乏南非、阿根廷等即将成为发达国家的选手。而我国则以13.6万亿的总量,成为美国之后另一个巨无霸般的存在。
来看看中美两个总体上占据世界 GDP 的比例情况
毫无疑问,这两个 GDP 总量占去世界 GDP 总量40%的国家,绝对是世界经济的命脉,相互合作,携手共赢才是世界经济的未来!
再来看下 top20 的情况

中低等收入国家
下面就是中低等收入的国家了,还是有很多熟悉的面孔啊

在这个级别当中,亚洲国家占据了大多数,但是 GDP 的总量却不是很低,尤其是印度,有2.7万亿的数量。这也能反映出,亚洲作为世界上人口最多的大洲,要走向发达国家的行列,还是任重道远啊!
top20 情况

低收入国家
最后就是低收入国家了,可以看到,在这些国家中,要不就是战乱频仍的国度,要不就是资源匮乏的小国,他们的经济建设之路还很漫长呢。

top20 的情况

GDP 总体排行
2018年 GDP 排行
先来看看2018年 GDP 总体排行的 top10 吧

可以看到,除了欧美诸强之外,中国、印度和巴西也纷纷上榜,发展中大国的实力不容小觑啊。
那么再来看看 GDP 总量倒数的10个国家呢

都是一些不大的国家,差距还是太大了!
历年各国 GDP 走势
我们先来看一下 GDP 总量排行前五的国家,历年 GDP 总量的走势情况
美国

中国

日本

德国

英国

可以看出,除了中美两国外,其他的国家 GDP 总量都出现过大幅度的波动情况,而持续增长的中美两国,则一骑绝尘,遥遥领先于世界了!
世界 GDP 地图
下面我们通过世界地图的方式来看看 GDP 的分布情况
我们先进行数据处理,把国家代码和 GDP 数据相结合
country_code = pd.read_json('countries.json')
country_code.rename(columns={'iso3': 'Country Code'}, inplace=True)
conutry_code_name = country_code[['name', 'Country Code']]
country_gdp_code = pd.merge(country_gdp, conutry_code_name, on='Country Code', how='inner')
由此,我们可以做出一张 GDP 总量的地图分布图

在这张 GDP 地图中,可以清晰的看出,美国和中国地盘大,颜色深,非常明显,隐隐有东西两强的趋势。
我们再去掉中美两国,看看剩余国家的 GDP 情况

在这张图中,可以看到日本、西欧和印度是一个级别的存在,而俄罗斯、加拿大、澳大利亚和巴西等是另外的一组,其余大部分的第三世界国家,则是第三组!
GDP 增长率
下面我们再来看看 GDP 增长率的情况,有的国家 GDP 本来总量就高,而且增长率还非常不错,那么未来的经济形式一定前途无量;而有的国家则举步维艰,低 GDP 总量再加上惨淡的增长率,未来的日子很难啊。
增长率 top10

在这份增长率 top10 榜单中,大部分的国家都是 GDP 较低的国家,这还是说明低 GDP 的增长空间是更加大的。
而印度则不一样,它本身的 GDP 总量已经非常高了,竟然还有这么高的 GDP 增长率,其未来的经济一片大好啊!
增长率 bottom10
再来看下增长率排名垫底的10个国家,这就比较闹心了

GDP 负增长就是说经济在后退啊,如何振兴经济应该是这些国家的首要任务了!
中美印对比

在图中可以看出,虽然近些年印度保持着很高的增长率,但是 GDP 总量增长并没有中美两国明显。
而美国的增长率常年在2%和1%之间震荡,好像还蛮有规律的。
对于我国来说,增长率已经从以前恐怖的10%慢慢回落了,但是经济增长的趋势是没法阻挡的!
增长率地图
最后还是在世界地图中整体看看 GDP 增长率的分布情况

总体来说,大部分国家的增长率都处于1%-4%的水平之间,而中亚和东南亚的部分国家可以保持增长率在4%-7%之间,只有极少部分国家能够达到7%以上的增长率,不过对于阿根廷来说,刺眼的负增长还是惊心的,这么多年了,经济还没有复苏的迹象吗?
最后,我们以一段 GDP 排行视频来结束今天的分享吧
视频是根据如下工具制作的,喜欢的可以自己动手尝试下
https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js