Course Code: textsum
Duration: 14 hours

Prerequisites:

  • 了解Python编程(Python 2.7/3.3+)
  • 大致了解Python库

Overview:

在Python机器学习中,文本摘要功能可以读取输入文本并生成文本摘要。这个功能可以从命令行或从Python API / 库中获得。一个令人兴奋的应用是执行摘要的快速创建;这对在做报告和演讲前需要审阅大量文本数据的组织特别有用。

在这一由讲师引导的现场培训中,学员将学习使用Python创建一个简单的可自动生成输入文本摘要的应用程序。

在本次培训结束后,学员将能够:

  • 使用一个命令行工具来总结文本。
  • 使用Python库设计和创建文本摘要代码。
  • 评估三个Python摘要库:sumy 0.7.0、psisummarization 1.0.4、readless 1.0.17

受众

  • 开发人员
  • 数据科学家

课程形式

  • 部分讲座、部分讨论、练习和大量实操

Course Outline:

用Python进行文本摘要的简介

  • 将示例文本与自动生成的摘要进行比较
  • 安装sumy(一个可执行文本摘要的Python命令行)
  • 把sumy作为命令行文本摘要工具使用(动手练习)

基于所记录的功能来评估三个Python摘要库:sumy 0.7.0、psisummarization 1.0.4、readless 1.0.17

选择一个库:sumy、pysummarization 或 readless

在Python 2.7/3.3+上使用sumy库创建一个Python应用程序

  • 为文本摘要安装sumy库
  • 在sumy库中使用Edmundson(Extraction,提取)方法

摘要

  • 创建简单的Python测试代码来使用sumy库生成文本摘要

在Python 2.7/3.3+上使用pysummarization库创建一个Python应用程序

  • 为文本摘要安装pysummarization库
  • 为文字摘要使用pysummarization库
  • 创建简单的Python测试代码来使用pysummarization库生成文本摘要

在Python 2.7/3.3+上使用readless库创建一个Python应用程序

  • 为文本摘要安装readless库
  • 为文字摘要使用readless库

创建简单的Python测试代码来使用readless库生成文本摘要

故障排除和调试

结束语