首页 > temp > python入门教程 >
-
易于理解的 python 深度学习摘要算法教程
“我不想要一份完整的报告,只要给我一份结果摘要就好”。我经常发现自己处于这种状况 -- 无论是在大学里还是在我的职业生涯中。我们准备一份全面的报告,但老师/主管却只有时间阅读摘要。
听起来很熟悉吧?嗯,我决定做点什么。手动将报告转换为汇总版本太耗时了,对吗?我能依靠吗 自然语言处理 (NLP) 帮助我的技巧?
这就是使用深度学习进行文本摘要真正帮助我的地方。它解决了一个一直困扰我的问题- 现在我们的模型可以理解整个文本的上下文 。对于我们所有需要快速知道文件摘要的人来说,这是一个梦想成真!
以及我们在深度学习中使用文本摘要获得的结果?了不起。因此,我在本文中,我们将逐步介绍构建 使用深度学习的文本摘要器 通过覆盖构建它所需的所有概念。然后,我们将在 Python 中实现我们的第一个文本摘要模型!
-
[A Must-Read Introduction to Sequence Modelling (with use cases)](https://www.analyticsvidhya.com/blog/2018/04/sequence-modelling-an-introduction-with-practical-use-cases/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python)
-
[Must-Read Tutorial to Learn Sequence Modeling (deeplearning.ai Course #5)](https://www.analyticsvidhya.com/blog/2019/01/sequence-models-deeplearning/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python)
-
[Essentials of Deep Learning: Introduction to Long Short Term Memory](https://www.analyticsvidhya.com/blog/2017/12/fundamentals-of-deep-learning-introduction-to-lstm/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python)
目录
- NLP中的文本摘要是什么?
- 序列到序列 (Seq2Seq) 建模介绍
- 了解编码器 - 解码器体系结构
- 编码器局限性 - 解码器体系结构
- 注意机制背后的直觉
- 理解问题说明书
- 使用 Keras 在 Python 中实现文本摘要
- 如何进一步提高模型的性能?
- 注意力机制是如何工作的?
1. NLP中的文本摘要是什么?
让我们先了解什么是文本摘要,然后再看看它是如何工作的。这里有一个简洁的定义来帮助我们开始:
“自动文本摘要是在保留关键信息内容和总体意义的同时生成简洁流畅的摘要的任务”
-文本总结技术: 简要调查,2017
有大致两种不同的方法用于文本总结:
- 提取概括
- 抽象概括
让我们更详细地看看这两种类型。
1.1 提取摘要
这个名字透露了这种方法的作用。 我们从原文中识别出重要的句子或短语,并且只从原文中提取那些。 那些提取的句子将是我们的总结。下图说明了提取摘要:
我建议仔细阅读下面的文章,使用TextRank算法构建提取文本摘要器:
- 使用TextRank算法的文本摘要介绍 (使用Python实现)
1.2 抽象摘要
这是一个非常有趣的方法。这里, 我们从原文生成新句子。 这与我们之前看到的只使用存在的句子的提取方法相反。通过抽象总结生成的句子可能不会出现在原文中:
你可能已经猜到了 -- 我们将在本文中使用深度学习来构建一个抽象的文本摘要器!在深入了解实现部分之前,让我们首先了解构建文本摘要器模型所需的概念。
前方是激动人心的时刻!
2. 序列到序列 (Seq2Seq) 建模介绍
我们可以针对涉及顺序信息的任何问题构建Seq2Seq模型。这包括情感分类、神经机器翻译和命名实体识别 -- 顺序信息的一些非常常见的应用。
在神经机器翻译的情况下,输入是一种语言的文本,输出也是另一种语言的文本: