当前位置:
首页 > temp > python入门教程 >
-
Python实用工具,fuzzywuzzy模块,Python实现鲁迅名言查询系统
开发工具
Python版本:3.6.4
相关模块:
PyQt5模块;
python-Levenshtein模块;
fuzzywuzzy模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
原理简介
首先,下载一份鲁迅全集的.txt文件:
然后用PyQt布局实现个简单的GUI:
'''简单的GUI'''
class GUI(QWidget):
def __init__(self, parent=None):
super().__init__()
self.setWindowTitle('鲁迅名言查询-微信公众号:Charles的皮卡丘')
self.setWindowIcon(QIcon('data/icon.jpg'))
self.label1 = QLabel('句子:')
self.line_edit = QLineEdit()
self.label2 = QLabel('查询结果:')
self.text = QTextEdit()
self.button = QPushButton()
self.button.setText('查询')
self.cmb = QComboBox()
self.cmb.setStyle(QStyleFactory.create('Fusion'))
self.cmb.addItem('匹配度: 100%')
self.cmb.addItem('匹配度: 90%')
self.cmb.addItem('匹配度: 80%')
self.cmb.addItem('匹配度: 70%')
self.grid = QGridLayout()
self.grid.setSpacing(12)
self.grid.addWidget(self.label1, 1, 0)
self.grid.addWidget(self.line_edit, 1, 1, 1, 38)
self.grid.addWidget(self.button, 1, 39)
self.grid.addWidget(self.label2, 2, 0)
self.grid.addWidget(self.text, 2, 1, 1, 40)
self.grid.addWidget(self.cmb, 1, 40)
self.setLayout(self.grid)
self.resize(200, 400)
self.button.clicked.connect(self.inquiry)
self.paragraphs = self.loadData('data/book.txt')
大概长这个样子:
那么接下来,只需要当用户点击查询按钮时,根据用户选择的匹配度下限,找到鲁迅全集的book.txt文件中的所有与待搜索句子匹配度大于该匹配度下限的段落并在查询结果框中显示出来即可。
在这里投机取巧偷个懒,直接当调包侠了,即这里直接使用了python的fuzzywuzzy包。
fuzzywuzzy是一个可以对字符串进行模糊匹配的小工具,使用起来非常简单。
这里我们直接调用它的partial_ratio方法来匹配两段话的相似度,并将相似度大于给定阈值的所有段落显示在结果框中。具体而言,代码实现如下:
'''查询'''
def inquiry(self):
sentence = self.line_edit.text()
matched = []
score_thresh = self.getScoreThresh()
if not sentence:
QMessageBox.warning(self, "Warning", '请先输入需要查询的鲁迅名言')
else:
for p in self.paragraphs:
score = fuzz.partial_ratio(p, sentence)
if score >= score_thresh and len(sentence) <= len(p):
matched.append([score, p])
infos = []
for match in matched:
infos.append('[匹配度]: %d\n[内容]: %s\n' % (match[0], match[1]))
if not infos:
infos.append('未匹配到任何相似度大于%d的句子.\n' % score_thresh)
self.text.setText('\n\n\n'.join(infos)[:-1])
文章到这里就结束了,感谢你的观看,关注我每天分享Python小工具系列,下篇文章不用声卡让电脑自己哼起歌
为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。
出处:https://www.cnblogs.com/daimubai/p/15123710.html
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
SQL Server -- 解决存储过程传入参数作为s
关于JS定时器的整理
JS中使用Promise.all控制所有的异步请求都完
js中字符串的方法
import-local执行流程与node模块路径解析流程
检测数据类型的四种方法
js中数组的方法,32种方法
前端操作方法
数据类型
window.localStorage.setItem 和 localStorage.setIte
如何完美解决前端数字计算精度丢失与数