Course Code:
kubeflow
Duration:
35 hours
Prerequisites:
- 熟悉 Python 语法
- 具有 Tensorflow、PyTorch 或其他机器学习框架的经验
- 具有必要资源的 AWS 账户
观众
- 开发 人员
- 数据科学家
Overview:
Kubeflow 是一个工具包,用于使 Machine Learning (ML) on Kubernetes 变得简单、可移植和可扩展。AWS EKS(弹性 Kubernetes 服务)是 Amazon 托管服务,用于在 AWS 上运行 Kubernetes。
这种以讲师为主导的现场培训(现场或远程)针对希望在Kubernetes上构建,部署和管理机器学习工作流的开发人员和数据科学家。
在培训结束时,参与者将能够:
- 使用 AWS EKS(弹性 Kubernetes 服务)在本地和云端安装和配置 Kubeflow。
- 基于 Docker 个容器和 Kubernetes 构建、部署和管理 ML 工作流。
- 在不同的架构和云环境中运行整个机器学习管道。
- 使用 Kubeflow 生成和管理 Jupyter 笔记本。
- 跨多个平台构建 ML 训练、超参数调优并为工作负载提供服务。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在现场实验室环境中实际实施。
课程定制选项
- 如需申请此课程的定制培训,请联系我们进行安排。
Course Outline:
介绍
- Kubernetes 简介
- Kubeflow 功能和体系结构概述
- Kubeflow 在 AWS 上、本地上、在其他公共云提供商上
使用 AWS EKS 设置集群
使用 Microk8s 设置本地集群
使用 GitOps 方法部署 Kubernetes
数据存储方法
创建 Kubeflow 管道
触发管道
定义输出工件
存储数据集和模型的元数据
使用 TensorFlow 进行超参数调优
可视化和分析结果
多GPU培训
创建用于部署 ML 模型的推理服务器
使用 JupyterHub
Networking 和负载均衡
自动扩展 Kubernetes 集群
故障 排除
总结和结论
Sites Published: