Course Code:
kubeflow
Duration:
35 hours
Prerequisites:
- 熟悉 Python 語法
- 具有 Tensorflow、PyTorch 或其他機器學習框架的經驗
- 具有必要資源的 AWS 帳戶
觀眾
- 開發人員
- 數據科學家
Overview:
Kubeflow 是一個工具包,用於使 Machine Learning (ML) on Kubernetes 變得簡單、可移植和可擴展。AWS EKS(彈性 Kubernetes 服務)是 Amazon 託管服務,用於在 AWS 上運行 Kubernetes。
這種以講師為主導的現場培訓(現場或遠端)針對希望在Kubernetes上構建,部署和管理機器學習工作流的開發人員和數據科學家。
在培訓結束時,參與者將能夠:
- 使用 AWS EKS(彈性 Kubernetes 服務)在本地和雲端安裝和配置 Kubeflow。
- 基於 Docker 個容器和 Kubernetes 構建、部署和管理 ML 工作流。
- 在不同的架構和雲環境中運行整個機器學習管道。
- 使用 Kubeflow 生成和管理 Jupyter 筆記本。
- 跨多個平台構建 ML 訓練、超參數調優併為工作負載提供服務。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在現場實驗室環境中實際實施。
課程定製選項
- 如需申請此課程的定製培訓,請聯繫我們進行安排。
Course Outline:
介紹
- Kubernetes 簡介
- Kubeflow 功能和體系結構概述
- Kubeflow 在 AWS 上、本地上、在其他公共雲供應商上
使用 AWS EKS 設置集群
使用Microk8s設置本地集群
使用 GitOps 方法部署 Kubernetes
數據存儲方法
創建 Kubeflow 管道
觸發管道
定義輸出工件
存儲數據集和模型的元數據
使用 TensorFlow 進行超參數調優
可視化和分析結果
多GPU培訓
創建用於部署 ML 模型的推理伺服器
使用 JupyterHub
Networking 和負載均衡
自動擴展 Kubernetes 集群
故障排除
總結和結論
Sites Published: