Course Code: textsum
Duration: 14 hours
Prerequisites:
- 了解Python编程(Python 2.7/3.3+)
- 大致了解Python库
Overview:
在Python机器学习中,文本摘要功能可以读取输入文本并生成文本摘要。这个功能可以从命令行或从Python API / 库中获得。一个令人兴奋的应用是执行摘要的快速创建;这对在做报告和演讲前需要审阅大量文本数据的组织特别有用。
在这一由讲师引导的现场培训中,学员将学习使用Python创建一个简单的可自动生成输入文本摘要的应用程序。
在本次培训结束后,学员将能够:
- 使用一个命令行工具来总结文本。
- 使用Python库设计和创建文本摘要代码。
- 评估三个Python摘要库:sumy 0.7.0、psisummarization 1.0.4、readless 1.0.17
受众
- 开发人员
- 数据科学家
课程形式
- 部分讲座、部分讨论、练习和大量实操
Course Outline:
用Python进行文本摘要的简介
- 将示例文本与自动生成的摘要进行比较
- 安装sumy(一个可执行文本摘要的Python命令行)
- 把sumy作为命令行文本摘要工具使用(动手练习)
基于所记录的功能来评估三个Python摘要库:sumy 0.7.0、psisummarization 1.0.4、readless 1.0.17
选择一个库:sumy、pysummarization 或 readless
在Python 2.7/3.3+上使用sumy库创建一个Python应用程序
- 为文本摘要安装sumy库
- 在sumy库中使用Edmundson(Extraction,提取)方法
摘要
- 创建简单的Python测试代码来使用sumy库生成文本摘要
在Python 2.7/3.3+上使用pysummarization库创建一个Python应用程序
- 为文本摘要安装pysummarization库
- 为文字摘要使用pysummarization库
- 创建简单的Python测试代码来使用pysummarization库生成文本摘要
在Python 2.7/3.3+上使用readless库创建一个Python应用程序
- 为文本摘要安装readless库
- 为文字摘要使用readless库
创建简单的Python测试代码来使用readless库生成文本摘要
故障排除和调试
结束语