VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > temp > python入门教程 >
  • Python实用工具,fuzzywuzzy模块,Python实现鲁迅名言查询系统

开发工具

Python版本:3.6.4

相关模块:

PyQt5模块;

python-Levenshtein模块;

fuzzywuzzy模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

原理简介

首先,下载一份鲁迅全集的.txt文件:

图片

然后用PyQt布局实现个简单的GUI:

'''简单的GUI'''
class GUI(QWidget):
  def __init__(self, parent=None):
    super().__init__()
    self.setWindowTitle('鲁迅名言查询-微信公众号:Charles的皮卡丘')
    self.setWindowIcon(QIcon('data/icon.jpg'))
    self.label1 = QLabel('句子:')
    self.line_edit = QLineEdit()
    self.label2 = QLabel('查询结果:')
    self.text = QTextEdit()
    self.button = QPushButton()
    self.button.setText('查询')
    self.cmb = QComboBox()
    self.cmb.setStyle(QStyleFactory.create('Fusion'))
    self.cmb.addItem('匹配度: 100%')
    self.cmb.addItem('匹配度: 90%')
    self.cmb.addItem('匹配度: 80%')
    self.cmb.addItem('匹配度: 70%')
    self.grid = QGridLayout()
    self.grid.setSpacing(12)
    self.grid.addWidget(self.label1, 1, 0)
    self.grid.addWidget(self.line_edit, 1, 1, 1, 38)
    self.grid.addWidget(self.button, 1, 39)
    self.grid.addWidget(self.label2, 2, 0)
    self.grid.addWidget(self.text, 2, 1, 1, 40)
    self.grid.addWidget(self.cmb, 1, 40)
    self.setLayout(self.grid)
    self.resize(200, 400)
    self.button.clicked.connect(self.inquiry)
    self.paragraphs = self.loadData('data/book.txt')

大概长这个样子:

image.png

那么接下来,只需要当用户点击查询按钮时,根据用户选择的匹配度下限,找到鲁迅全集的book.txt文件中的所有与待搜索句子匹配度大于该匹配度下限的段落并在查询结果框中显示出来即可。

在这里投机取巧偷个懒,直接当调包侠了,即这里直接使用了python的fuzzywuzzy包。

fuzzywuzzy是一个可以对字符串进行模糊匹配的小工具,使用起来非常简单。

这里我们直接调用它的partial_ratio方法来匹配两段话的相似度,并将相似度大于给定阈值的所有段落显示在结果框中。具体而言,代码实现如下:

 '''查询'''
  def inquiry(self):
    sentence = self.line_edit.text()
    matched = []
    score_thresh = self.getScoreThresh()
    if not sentence:
      QMessageBox.warning(self, "Warning", '请先输入需要查询的鲁迅名言')
    else:
      for p in self.paragraphs:
        score = fuzz.partial_ratio(p, sentence)
        if score >= score_thresh and len(sentence) <= len(p):
          matched.append([score, p])
      infos = []
      for match in matched:
        infos.append('[匹配度]: %d\n[内容]: %s\n' % (match[0], match[1]))
      if not infos:
        infos.append('未匹配到任何相似度大于%d的句子.\n' % score_thresh)
      self.text.setText('\n\n\n'.join(infos)[:-1])

文章到这里就结束了,感谢你的观看,关注我每天分享Python小工具系列,下篇文章不用声卡让电脑自己哼起歌

为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。

出处:https://www.cnblogs.com/daimubai/p/15123710.html


相关教程