当前位置:
首页 > Python基础教程 >
-
关于jieba.cut与jieba.lcut的区别及说明
jieba.cut与jieba.lcut的区别
jieba.cut生成的是一个生成器,generator,也就是可以通过for循环来取里面的每一个词。
word_list= [word for word in jieba.cut(text)]
jieba.lcut 直接生成的就是一个list
Prefix dict has been built succesfully.
Full Model 我/来/北京/上学
['我', '来', '北京', '上学']
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
cut
cut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词
lcut
lcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()
prosseg的方法
posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析
s = '我们都是小青蛙 呱呱呱呱 喜欢快乐的生活 还会讲笑话'
import jieba
jieba.cut(s) # <generator object cut at 0x10a6e5500>
list(jieba.cut(s)) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
jieba.lcut(s) # [u'\u6211\u4eec', u'\u90fd', u'\u662f',...]
import jieba.posseg
jieba.posseg.cut(s) # <generator object cut at 0x10cc80eb0>
list(jieba.posseg.cut(s)) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
jieba.posseg.lcut(s) # [pair(u'\u6211\u4eec', u'r'), pair(u'\u90fd', u'd')...]
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持
原文链接:https://blog.csdn.net/stay_foolish12/article/details/107466309
栏目列表
最新更新
详解MyBatis延迟加载是如何实现的
IDEA 控制台中文乱码4种解决方案
SpringBoot中版本兼容性处理的实现示例
Spring的IOC解决程序耦合的实现
详解Spring多数据源如何切换
Java报错:UnsupportedOperationException in Col
使用Spring Batch实现批处理任务的详细教程
java中怎么将多个音频文件拼接合成一个
SpringBoot整合ES多个精确值查询 terms功能实
Java使用poi生成word文档的简单实例
计算机二级考试MySQL常考点 8种MySQL数据库
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
uniapp/H5 获取手机桌面壁纸 (静态壁纸)
[前端] DNS解析与优化
为什么在js中需要添加addEventListener()?
JS模块化系统
js通过Object.defineProperty() 定义和控制对象
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比