VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > python入门教程 >
  • Python爬虫实战,nltk模块,实现推特数据可视化分析

前言

今天为大家带来的是可视化分析一波推特,让我们愉快地开始吧~

开发工具

** Python版本:**3.6.4

** 相关模块:**

nltk模块;

pandas模块;

wordcloud模块;

cutecharts模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

可视化分析

首先,我们要借助panda库读取我们下载到的推特数据,并做一些必要的数据预处理工作。具体而言,代码实现如下:

'''读取csv文件'''

接着,我们就可以借助cutecharts进行一些可爱的可视化分析啦。首先,让我们来看看每年都发了多少推特呗:

ta越来越享受"推特治国"了。而且这货19年的时候怕是一天到晚都在发推特的节奏啊(感觉朋友圈的微商都做不到一年如一日地坚持每天发20多条朋友圈T_T)。

对了,上图的源代码如下,还是蛮简单的:

'''折线图'''

再来看看都是用哪些豪华的设备来发推特的呗(只显示用的最多的5个设备):

再贴一下他用过的所有发推特的设备吧:

Twitter for iPhone          15468

嚯,这货的设备还挺齐全。对了,上面的柱状图实现和折线图类似,只需要把折线图改成柱状图就行了:

chart = Bar(title)

接下来,我们再来看看比较喜欢在哪个时间段发推特吧:

真是个精力旺盛的ZT。T_T

再来看看每年在推特里次数呗:

cutecharts画饼状图的代码实现如下:

def drawPie(title, data, savedir='results'):

再来简单证实一下我的猜测:

再来看看媒体呗:

图片

让我们来看看荣登榜一的FOX是啥吧:

不多废话,我还想看看发推特时对媒体的评价态度。为了画的图比较好看,我们这里假设只要负面评价得分大于0.1的都算负面推特,然后正面评价得分大于0.2的都算正面推特:

这里评分是利用python的nltk库做的,不一定准。对了,画雷达图的代码实现如下:

'''雷达图'''

 

 

出处:https://www.cnblogs.com/daimubai/p/14981727.html


相关教程