- Doświadczenie w pracy z pipeline'ami trenowania lub wdrażania modeli AI
- Zrozumienie zasad obliczeń i optymalizacji modeli GPU/MLU
- Podstawowa znajomość narzędzi i wskaźników profilowania wydajności
Grupa docelowa
- Inżynierowie wydajności
- Zespoły infrastruktury uczenia maszynowego
- Architekci systemów AI
Ascend, Biren i Cambricon są wiodącymi platformami sprzętowymi AI w Chinach, każda z nich oferuje unikalne narzędzia do przyspieszenia i profilowania dla zadań AI na skalę produkcyjną.
Ten szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do zaawansowanych inżynierów infrastruktury AI i wydajności, którzy chcą optymalizować przepływy wnioskowania modeli i uczenia się w różnych chińskich platformach układów scalonych AI.
Po zakończeniu tego szkolenia uczestnicy będą w stanie:
- Benchmarkować modele na platformach Ascend, Biren i Cambricon.
- Wykrywać wąskie gardła systemowe i niedoskonałości w pamięci/obliczeniach.
- Zastosować optymalizacje na poziomie grafu, jądra i operacji.
- Dostosować kanały wdrażania w celu poprawy przepływu i opóźnienia.
Format Kursu
- Interaktywne wykłady i dyskusje.
- Praktyczne używanie narzędzi profilowania i optymalizacji na każdej platformie.
- Wskazówki dotyczące ćwiczeń skupionych na praktycznych scenariuszach dostosowywania.
Opcje dostosowania kursu
- Aby zapytać o dostosowane szkolenie dla tego kursu na podstawie Twojego środowiska wydajności lub typu modelu, skontaktuj się z nami, aby to załatwić.
Pojęcia i metryki wydajności
- Opóźnienie, przepustowość, zużycie energii, wykorzystanie zasobów
- Uwężenia poziomu systemu vs modelu
- Profilowanie dla inferencji vs treningu
Profilowanie na Huawei Ascend
- Używanie CANN Profiler i MindInsight
- Diagnoza jąder i operatorów
- Wzorce rozładowywania i mapowania pamięci
Profilowanie na Biren GPU
- Funkcje monitorowania wydajności Biren SDK
- Fuzja jąder, wyrównanie pamięci i kolejki wykonania
- Profilowanie z uwzględnieniem mocy i temperatury
Profilowanie na Cambricon MLU
- Narzędzia wydajnościowe BANGPy i Neuware
- Widoczność poziomu jąder i interpretacja logów
- Integracja MLU profiler z ramami wdrażania
Optymalizacja na poziomie grafu i modelu
- Strategie obcinania grafu i kwantyzacji
- Fuzja operatorów i restrukturyzacja grafu obliczeniowego
- Standaryzacja rozmiaru wejścia i dostosowanie partii
Optymalizacja pamięci i jąder
- Optymalizacja układu pamięci i jej ponownego użycia
- Efektywne zarządzanie buforami w różnych zestawach chipów
- Techniki dostrajania poziomu jąder dla poszczególnych platform
Najlepsze praktyki w zakresie wieloplatformowości
- Portowalność wydajności: strategie abstrakcji
- Budowanie wspólnych kanałów dostrajania dla środowisk wielochipowych
- Przykład: dostrajanie modelu wykrywania obiektów na platformach Ascend, Biren i MLU
Podsumowanie i następne kroki
United Arab Emirates - Performance Optimization on Ascend, Biren, and Cambricon
Qatar - Performance Optimization on Ascend, Biren, and Cambricon
Egypt - Performance Optimization on Ascend, Biren, and Cambricon
Saudi Arabia - Performance Optimization on Ascend, Biren, and Cambricon
South Africa - Performance Optimization on Ascend, Biren, and Cambricon
Brasil - Performance Optimization on Ascend, Biren, and Cambricon
Canada - Performance Optimization on Ascend, Biren, and Cambricon
中国 - Performance Optimization on Ascend, Biren, and Cambricon
香港 - Performance Optimization on Ascend, Biren, and Cambricon
澳門 - Performance Optimization on Ascend, Biren, and Cambricon
台灣 - Performance Optimization on Ascend, Biren, and Cambricon
USA - Performance Optimization on Ascend, Biren, and Cambricon
Österreich - Performance Optimization on Ascend, Biren, and Cambricon
Schweiz - Performance Optimization on Ascend, Biren, and Cambricon
Deutschland - Performance Optimization on Ascend, Biren, and Cambricon
Czech Republic - Performance Optimization on Ascend, Biren, and Cambricon
Denmark - Performance Optimization on Ascend, Biren, and Cambricon
Estonia - Performance Optimization on Ascend, Biren, and Cambricon
Finland - Performance Optimization on Ascend, Biren, and Cambricon
Greece - Performance Optimization on Ascend, Biren, and Cambricon
Magyarország - Performance Optimization on Ascend, Biren, and Cambricon
Ireland - Performance Optimization on Ascend, Biren, and Cambricon
Luxembourg - Performance Optimization on Ascend, Biren, and Cambricon
Latvia - Performance Optimization on Ascend, Biren, and Cambricon
España - Performance Optimization on Ascend, Biren, and Cambricon
Italia - Performance Optimization on Ascend, Biren, and Cambricon
Lithuania - Performance Optimization on Ascend, Biren, and Cambricon
Nederland - Performance Optimization on Ascend, Biren, and Cambricon
Norway - Performance Optimization on Ascend, Biren, and Cambricon
Portugal - Performance Optimization on Ascend, Biren, and Cambricon
România - Performance Optimization on Ascend, Biren, and Cambricon
Sverige - Performance Optimization on Ascend, Biren, and Cambricon
Türkiye - Performance Optimization on Ascend, Biren, and Cambricon
Malta - Performance Optimization on Ascend, Biren, and Cambricon
Belgique - Performance Optimization on Ascend, Biren, and Cambricon
France - Performance Optimization on Ascend, Biren, and Cambricon
日本 - Performance Optimization on Ascend, Biren, and Cambricon
Australia - Performance Optimization on Ascend, Biren, and Cambricon
Malaysia - Performance Optimization on Ascend, Biren, and Cambricon
New Zealand - Performance Optimization on Ascend, Biren, and Cambricon
Philippines - Performance Optimization on Ascend, Biren, and Cambricon
Singapore - Performance Optimization on Ascend, Biren, and Cambricon
Thailand - Performance Optimization on Ascend, Biren, and Cambricon
Vietnam - Performance Optimization on Ascend, Biren, and Cambricon
India - Performance Optimization on Ascend, Biren, and Cambricon
Argentina - Performance Optimization on Ascend, Biren, and Cambricon
Chile - Performance Optimization on Ascend, Biren, and Cambricon
Costa Rica - Performance Optimization on Ascend, Biren, and Cambricon
Ecuador - Performance Optimization on Ascend, Biren, and Cambricon
Guatemala - Performance Optimization on Ascend, Biren, and Cambricon
Colombia - Performance Optimization on Ascend, Biren, and Cambricon
México - Performance Optimization on Ascend, Biren, and Cambricon
Panama - Performance Optimization on Ascend, Biren, and Cambricon
Peru - Performance Optimization on Ascend, Biren, and Cambricon
Uruguay - Performance Optimization on Ascend, Biren, and Cambricon
Venezuela - Performance Optimization on Ascend, Biren, and Cambricon
Polska - Performance Optimization on Ascend, Biren, and Cambricon
United Kingdom - Performance Optimization on Ascend, Biren, and Cambricon
South Korea - Performance Optimization on Ascend, Biren, and Cambricon
Pakistan - Performance Optimization on Ascend, Biren, and Cambricon
Sri Lanka - Performance Optimization on Ascend, Biren, and Cambricon
Bulgaria - Performance Optimization on Ascend, Biren, and Cambricon
Bolivia - Performance Optimization on Ascend, Biren, and Cambricon
Indonesia - Performance Optimization on Ascend, Biren, and Cambricon
Kazakhstan - Performance Optimization on Ascend, Biren, and Cambricon
Moldova - Performance Optimization on Ascend, Biren, and Cambricon
Morocco - Performance Optimization on Ascend, Biren, and Cambricon
Tunisia - Performance Optimization on Ascend, Biren, and Cambricon
Kuwait - Performance Optimization on Ascend, Biren, and Cambricon
Oman - Performance Optimization on Ascend, Biren, and Cambricon
Slovakia - Performance Optimization on Ascend, Biren, and Cambricon
Kenya - Performance Optimization on Ascend, Biren, and Cambricon
Nigeria - Performance Optimization on Ascend, Biren, and Cambricon
Botswana - Performance Optimization on Ascend, Biren, and Cambricon
Slovenia - Performance Optimization on Ascend, Biren, and Cambricon
Croatia - Performance Optimization on Ascend, Biren, and Cambricon
Serbia - Performance Optimization on Ascend, Biren, and Cambricon
Bhutan - Performance Optimization on Ascend, Biren, and Cambricon
Nepal - Performance Optimization on Ascend, Biren, and Cambricon
Uzbekistan - Performance Optimization on Ascend, Biren, and Cambricon