Course Code: airflowds
Duration: 21 hours
Prerequisites:

  • 熟悉机器学习工作流和概念
  • 对Apache Airflow的基本了解,包括DAG和操作符
  • 熟练掌握Python编程

受众

  • 数据科学家
  • 机器学习工程师
  • AI开发者

Overview:

Apache Airflow 是一个开源平台,用于编排工作流和自动化复杂的数据管道。

本课程由讲师主导,采用线上或线下培训形式,面向希望自动化和管理机器学习工作流的中级参与者,包括使用 Apache Airflow 进行模型训练、验证和部署。

在本培训结束时,参与者将能够:

  • 为机器学习工作流编排设置 Apache Airflow。
  • 自动化数据预处理、模型训练和验证任务。
  • 将 Airflow 与机器学习框架和工具集成。
  • 使用自动化管道部署机器学习模型。
  • 监控和优化生产中的机器学习工作流。

课程形式

  • 互动讲座和讨论。
  • 大量练习和实践。
  • 在实时实验室环境中进行动手实践。

课程定制选项

  • 如需为本课程定制培训,请联系我们安排。

Course Outline:

Apache Airflow机器学习入门

  • Apache Airflow概述及其在数据科学中的重要性
  • 自动化机器学习工作流的关键功能
  • 为数据科学项目设置Airflow

使用Airflow构建机器学习管道

  • 设计端到端机器学习工作流的DAGs
  • 使用操作符进行数据摄取、预处理和特征工程
  • 调度和管理管道依赖关系

模型训练与验证

  • 使用Airflow自动化模型训练任务
  • 将Airflow与机器学习框架(如TensorFlow、PyTorch)集成
  • 验证模型并存储评估指标

模型部署与监控

  • 使用自动化管道部署机器学习模型
  • 使用Airflow任务监控已部署的模型
  • 处理重新训练和模型更新

高级定制与集成

  • 开发用于机器学习任务的定制操作符
  • 将Airflow与云平台和机器学习服务集成
  • 使用插件和传感器扩展Airflow工作流

优化与扩展机器学习管道

  • 提高大规模数据的工作流性能
  • 使用Celery和Kubernetes扩展Airflow部署
  • 生产级机器学习工作流的最佳实践

案例研究与实际应用

  • 使用Airflow进行机器学习自动化的实际案例
  • 实践练习:构建端到端机器学习管道
  • 讨论机器学习工作流管理中的挑战与解决方案

总结与下一步

Overview in Category:

本次由讲师指导的培训(线上或线下)面向中级参与者,旨在帮助他们使用Apache Airflow自动化和管理机器学习工作流,包括模型训练、验证和部署。

培训结束后,参与者将能够:

  • 设置Apache Airflow以进行机器学习工作流编排。
  • 自动化数据预处理、模型训练和验证任务。
  • 将Airflow与机器学习框架和工具集成。
  • 使用自动化管道部署机器学习模型。
  • 监控和优化生产中的机器学习工作流。