- Znajomość składni Python
- Doświadczenie z Tensorflow, PyTorch lub innym frameworkiem uczenia maszynowego
- Konto AWS z niezbędnymi zasobami
Publiczność
- Programiści
- Naukowcy zajmujący się danymi
Kubeflow to zestaw narzędzi umożliwiający łatwe, przenośne i skalowalne Machine Learning (ML) na Kubernetes. AWS EKS (Elastic Kubernetes Service) to usługa zarządzana przez Amazon do uruchamiania Kubernetes na AWS.
To prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla programistów i naukowców zajmujących się danymi, którzy chcą budować, wdrażać i zarządzać przepływami pracy uczenia maszynowego na Kubernetes.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować Kubeflow na miejscu i w chmurze za pomocą AWS EKS (Elastic Kubernetes Service).
- Budować, wdrażać i zarządzać przepływami pracy ML w oparciu o kontenery Docker i Kubernetes.
- Uruchamianie całych potoków uczenia maszynowego w różnych architekturach i środowiskach chmurowych.
- Używanie Kubeflow do tworzenia i zarządzania notatnikami Jupyter.
- Tworzenie szkoleń ML, dostrajanie hiperparametrów i obsługiwanie obciążeń na wielu platformach.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku laboratorium na żywo.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami w celu ustalenia szczegółów.
Wprowadzenie
- Wprowadzenie do Kubernetes
- Przegląd funkcji i architektury Kubeflow
- Kubeflow w AWS vs. lokalnie vs. u innych dostawców chmury publicznej
Konfiguracja klastra przy użyciu AWS EKS
Konfigurowanie klastra lokalnego przy użyciu Microk8s
Wdrażanie Kubernetes przy użyciu podejścia GitOps
Podejścia do przechowywania danych
Tworzenie Kubeflow potoku
Wyzwalanie potoku
Definiowanie artefaktów wyjściowych
Przechowywanie metadanych dla zestawów danych i modeli
Dostrajanie hiperparametrów za pomocą TensorFlow
Wizualizacja i analiza wyników
Multi-GPU Training
Tworzenie serwera wnioskowania do wdrażania modeli uczenia maszynowego
Praca z JupyterHub
Równoważenie obciążenia Networking
Automatyczne skalowanie klastra Kubernetes
Rozwiązywanie problemów
Podsumowanie i wnioski