VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > Python基础教程 >
  • Jieba库使用和好玩的词云(2)

但是运行出现错误,

这是因为没有写明文本所在的绝对路径,以致找不到文本,打开文本属性找到位置复制即可。

但是这样依旧执行错误,

win10电脑文本编码默认为ASCII码,我们应将其改为UTF-8,打开 hongloumeng.txt --文件--另存为--编码--UTF-8,取名为  shitouji.txt   ,按照上述方法找到新的文本位置即可。改正的代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#DreaminRedMansions.py
import jieba   #调用jieba库
 
txt = open("D:\我爱学习\python3\wenben\shitouji.txt","r",encoding="UTF-8").read()  #打开txt文件阅读
 
words = jieba.lcut(txt)    #分词
counts = {}   #建立一个空字典
for word in words:
    if len(word)==1:
        continue
    else:
        counts[word]=counts.get(word,0+ 1    #遍历每个中文单词,通过字典来计数
items = list(counts.items())    #将字典counts转换为列表类型
items.sort(key=lambda x:x[1],reverse = True)   #对列表进行排序
for in range(20):
    word,count = items[i]
    print("{0:<10}{1:>5}".format(word,count))     #打印出前20个词

  效果如下:

 

三、词云展现

1、运用jieba库和wordcloud库,代码如下:注: .join( )函数:   连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
from wordcloud import WordCloud
import jieba
def create_word_cloud():
    path_txt = 'D:\我爱学习\python3\wenben\\shitouji.txt'
    
    text = open(path_txt,"r",encoding="UTF-8").read()
    
    wordlist = jieba.lcut(text) # jieba分词
    wl = " ".join(wordlist)
 
    # 设置词云
    = WordCloud(
        # 设置背景颜色为白色
        background_color="white",
        # 设置最大显示的词云数为200
        max_words=200,
        # 字体的一般路径--宋体
        font_path='simsun.ttc',
        height=1200,
        width=1600,
        # 设置字体最大的字体大小
        max_font_size=100,
        # 设置配色方案
        random_state=100,
    )
 
 
    w.generate(wl)  # 生成词云
    w.to_file('img_book1.png')  # 把词云保存下
 
 
if __name__ == '__main__':
    create_word_cloud()

相关教程