首页 > temp > python入门教程 >
-
【Python情感分析】用python情感分析李子柒频道视频热门评论
一、事件背景
今天是2021.12.2日,距离李子柒断更已经4个多月了,这是我在YouTube李子柒油管频道上,观看李子柒2021年7月14日上传的最后一条视频,我录制了视频下方的来自全世界各国网友的评论,全世界的网友们集体期待李子柒回归,瞬间泪奔。
https://zhuanlan.zhihu.com/p/440462123
针对全世界网友的热门评论,怎么分析出网友的评论态度和舆论导向呢?于是我试着用python做了情感分析,得出了一些舆情导向的结论。
二、python代码讲解
下面,通过python代码(部分核心代码)逐一分解,这个情感分析是怎样实现的:
首先,导入需要的库:
1 import pandas as pd # 数据分析库 2 from textblob import TextBlob # 英文情感分析库 3 import matplotlib.pyplot as plt # 画图 4 from wordcloud import WordCloud # 绘制词云图 5 from wordcloud import ImageColorGenerator 6 from PIL import Image 7 import numpy as np
然后,通过pandas读取excel评论数据(爬虫代码不做讲解,对爬虫代码感兴趣的小伙伴可以私聊我哦)
1 file = "李子柒评论.xlsx" 2 df = pd.read_excel(file, usecols=[1, 2, 3, 4, 5]) #读取评论数据 3 v_cmt_list = df['text'].values.tolist() # 把评论字段转换为list 4 print('length of v_cmt_list is:{}'.format(len(v_cmt_list)))
下面是情感分析的代码:
1 # 情感分析 2 score_list = [] # 情感评分值 3 tag_list = [] # 打标分类结果 4 for comment in v_cmt_list: 5 tag = '' 6 judge = TextBlob(comment) 7 sentiments_score = judge.sentiment.polarity 8 score_list.append(sentiments_score) 9 if sentiments_score < 0: 10 tag = '消极' 11 elif sentiments_score == 0: 12 tag = '中性' 13 else: 14 tag = '积极' 15 tag_list.append(tag) 16 df['情感得分'] = score_list 17 df['分析结果'] = tag_list 18 df.to_excel('情感分析结果.xlsx', index=None)
查看一下情感分析结果:
1 df.groupby(by=['分析结果']).count()['text'] # 分组统计情感分析结果
结果显示,中性和积极词汇占据一半以上,也就是说,大部分网友还是喜欢李子柒的视频的。
最后是词云图绘制的代码:
1 # 绘制词云图 2 stopwords = ['the', 'a', 'and', 'of', 'it', 'her', 'she', 'if', 'I', 'is', 'not', 'your', 'there', 'this', 3 'that', 'to', 'you', 'in', 'as', 'for', 'are', 'so', 'was', 'but', 'with', 'they', 'have'] # 停用词 4 coloring = np.array(Image.open("lzq3.jpeg")) 5 backgroud_Image = coloring # 读取背景图片 6 wc = WordCloud( 7 scale=3, # 图片大小,清晰度 8 background_color="white", # 背景颜色 9 max_words=1000, # 词数量 10 font_path='/System/Library/Fonts/SimHei.ttf', # Mac字体文件路径,根据实际情况替换 11 # font_path="C:\Windows\Fonts\simhei.ttf", # Win字体文件路径,根据实际情况替换 12 stopwords=stopwords, # 停用词 13 mask=backgroud_Image, # 背景图片 14 color_func=ImageColorGenerator(coloring), # 根据原始图片颜色生成词云图颜色 15 max_font_size=100, # 设置字体最大值 16 random_state=240 # 设置有多少种随机生成状态,即有多少种配色方案 17 ) 18 wc.generate(v_cmt_str) # 生成词云图 19 wc.to_file('词云结果图.png') # 保存图片文件 20 display(Image.open('lzq3.jpeg')) # 显示原始图片 21 wc.to_image() # 显示词云图
词云图最后的展示效果如下:
这里需要说明的是,color_func=ImageColorGenerator(coloring)这句代码,能够根据原始图片颜色生成词云图颜色。细心的小伙伴应该能看出来,词云图的颜色配比和原始图片的颜色配比很接近了。
三、同步讲解视频
https://www.zhihu.com/zvideo/1449696394374684672
四、获取python源码文件
爱学习的小伙伴,想获取完整python代码文件,关注我的微信公众号"老男孩的平凡之路",后台回复"李子柒情感分析",即可获取完整python源码及结果文件。
首发公号文章:
https://mp.weixin.qq.com/s?__biz=MzU5MjQ2MzI0Nw==&mid=2247484565&idx=1&sn=ffd0f5e69a490f3fcf82109ea637b721&chksm=fe1e1075c9699963af56beda45cc010a1b515f87aa68a6443878a8e575e6ca57b53f4b449475&payreadticket=HLFBI00L_inc8Ul4LG_PKeZ9lkYuDEDLi03J5hjohpGC_by7jTbbayE1YtcMmWfrWKtLd7Y#rd
出处:https://www.cnblogs.com/mashukui/p/16220254.html