Course Code: aiopsact
Duration: 14 hours
Prerequisites:
  • Doświadczenie z systemami monitorowania takimi jak Prometheus lub ELK
  • Znajomość Python i podstaw maszynowego uczenia
  • Zapoznanie z procesami zarządzania incydentami

Grupa docelowa

  • Starszy inżynierowie ds. niezawodności serwisów (SRE)
  • Architekci automatyzacji IT
  • DevOps i liderzy platform obserwacyjnych
Overview:

AIOps (Sztuczna inteligencja dla operacji IT) jest coraz częściej wykorzystywana do przewidywania incydentów zanim się wydarzą i automatyzacji analizy przyczyn pierwotnych (RCA) w celu minimalizacji czasu przerwy i przyspieszenia rozwiązywania problemów.

To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do zaawansowanych profesjonalistów IT, którzy chcą wdrożyć analitykę przewidywującą, automatyzować naprawę i projektować inteligentne przepływy analizy RCA z użyciem narzędzi AIOps i modeli uczenia maszynowego.

Po zakończeniu tego szkolenia uczestnicy będą w stanie:

  • Budować i trenować modele ML do wykrywania wzorców prowadzących do awarii systemów.
  • Automatyzować przepływy analizy RCA na podstawie korelacji logów i metryk z wielu źródeł.
  • Integrować procesy alertowania i naprawy z istniejącymi platformami.
  • Wdrażać i skalować inteligentne rurociągi AIOps w środowiskach produkcyjnych.

Format kursu

  • Interaktywne wykłady i dyskusje.
  • Wiele ćwiczeń i praktyki.
  • Ręczna implementacja w środowisku live-lab.

Opcje dostosowania kursu

  • Aby poprosić o dostosowane szkolenie dla tego kursu, skontaktuj się z nami w celu umówienia.
Course Outline:

Wprowadzenie do Predictive AIOps

  • Przegląd analityki predykcyjnej w IT operations
  • Źródła danych do prognozowania (logi, metryki, zdarzenia)
  • Kluczowe koncepcje w prognozowaniu czasowych szeregów i wzorcach anomalii

Projektowanie modeli predykcji incydentów

  • Oznaczanie historycznych incydentów i zachowań systemu
  • Wybór i trenowanie modeli (np. LSTM, Random Forest, AutoML)
  • Ocenianie wydajności modelu i obsługa fałszywych pozytywnych

Zbieranie danych i inżynieria cech

  • Wprowadzanie i wyrównywanie danych logów i metryk do modelu wejściowego
  • Ekstrakcja cech z danych strukturowanych i niestrukturowanych
  • Obsługa szumu i braków danych w operacyjnych pipeline'ach

Automatyzacja analizy przyczyny pierwszego stopnia (RCA)

  • Korygowanie usług i infrastruktury na podstawie grafu
  • Używanie ML do wywnioskowania prawdopodobnych przyczyn pierwszych stopnia z łańcuchów zdarzeń
  • Wizualizacja RCA za pomocą pulpitu sterowania z wiedzą o topologii

Naprawianie i Workflow Automation

  • Integracja z platformami automatyzacji (np. Ansible, Rundeck)
  • Wyzwalanie cofnięć, ponownych uruchomień lub przekierowania ruchu
  • Audytowanie i dokumentowanie automatycznych interwencji

Skalowanie inteligentnych pipeline'ów AIOps

  • MLOps do obserwowalności: ponowne trenowanie i wersjonowanie modeli
  • Przeprowadzanie prognoz w czasie rzeczywistym na rozproszonych węzłach
  • Najlepsze praktyki wdrażania AIOps w środowiskach produkcyjnych

Przypadki użycia i praktyczne zastosowania

  • Analiza rzeczywistych danych incydentów z użyciem predykcyjnych modeli AIOps
  • Wdrażanie pipeline'ów RCA z użyciem syntetycznych i rzeczywistych danych
  • Przegląd przypadków użycia w branży: awarie chmur, niestabilność mikrousług, degradacja sieci

Podsumowanie i następne kroki

Sites Published:

United Arab Emirates - AIOps in Action: Incident Prediction and Root Cause Automation

Qatar - AIOps in Action: Incident Prediction and Root Cause Automation

Egypt - AIOps in Action: Incident Prediction and Root Cause Automation

Saudi Arabia - AIOps in Action: Incident Prediction and Root Cause Automation

South Africa - AIOps in Action: Incident Prediction and Root Cause Automation

Brasil - AIOps in Action: Incident Prediction and Root Cause Automation

Canada - AIOps in Action: Incident Prediction and Root Cause Automation

中国 - AIOps in Action: Incident Prediction and Root Cause Automation

香港 - AIOps in Action: Incident Prediction and Root Cause Automation

澳門 - AIOps in Action: Incident Prediction and Root Cause Automation

台灣 - AIOps in Action: Incident Prediction and Root Cause Automation

USA - AIOps in Action: Incident Prediction and Root Cause Automation

Österreich - AIOps in Action: Incident Prediction and Root Cause Automation

Schweiz - AIOps in Action: Incident Prediction and Root Cause Automation

Deutschland - AIOps in Action: Incident Prediction and Root Cause Automation

Czech Republic - AIOps in Action: Incident Prediction and Root Cause Automation

Denmark - AIOps in Action: Incident Prediction and Root Cause Automation

Estonia - AIOps in Action: Incident Prediction and Root Cause Automation

Finland - AIOps in Action: Incident Prediction and Root Cause Automation

Greece - AIOps in Action: Incident Prediction and Root Cause Automation

Magyarország - AIOps in Action: Incident Prediction and Root Cause Automation

Ireland - AIOps in Action: Incident Prediction and Root Cause Automation

Luxembourg - AIOps in Action: Incident Prediction and Root Cause Automation

Latvia - AIOps in Action: Incident Prediction and Root Cause Automation

España - AIOps in Action: Incident Prediction and Root Cause Automation

Italia - AIOps in Action: Incident Prediction and Root Cause Automation

Lithuania - AIOps in Action: Incident Prediction and Root Cause Automation

Nederland - AIOps in Action: Incident Prediction and Root Cause Automation

Norway - AIOps in Action: Incident Prediction and Root Cause Automation

Portugal - AIOps in Action: Incident Prediction and Root Cause Automation

România - AIOps in Action: Incident Prediction and Root Cause Automation

Sverige - AIOps in Action: Incident Prediction and Root Cause Automation

Türkiye - AIOps in Action: Incident Prediction and Root Cause Automation

Malta - AIOps in Action: Incident Prediction and Root Cause Automation

Belgique - AIOps in Action: Incident Prediction and Root Cause Automation

France - AIOps in Action: Incident Prediction and Root Cause Automation

日本 - AIOps in Action: Incident Prediction and Root Cause Automation

Australia - AIOps in Action: Incident Prediction and Root Cause Automation

Malaysia - AIOps in Action: Incident Prediction and Root Cause Automation

New Zealand - AIOps in Action: Incident Prediction and Root Cause Automation

Philippines - AIOps in Action: Incident Prediction and Root Cause Automation

Singapore - AIOps in Action: Incident Prediction and Root Cause Automation

Thailand - AIOps in Action: Incident Prediction and Root Cause Automation

Vietnam - AIOps in Action: Incident Prediction and Root Cause Automation

India - AIOps in Action: Incident Prediction and Root Cause Automation

Argentina - AIOps in Action: Incident Prediction and Root Cause Automation

Chile - AIOps in Action: Incident Prediction and Root Cause Automation

Costa Rica - AIOps in Action: Incident Prediction and Root Cause Automation

Ecuador - AIOps in Action: Incident Prediction and Root Cause Automation

Guatemala - AIOps in Action: Incident Prediction and Root Cause Automation

Colombia - AIOps in Action: Incident Prediction and Root Cause Automation

México - AIOps in Action: Incident Prediction and Root Cause Automation

Panama - AIOps in Action: Incident Prediction and Root Cause Automation

Peru - AIOps in Action: Incident Prediction and Root Cause Automation

Uruguay - AIOps in Action: Incident Prediction and Root Cause Automation

Venezuela - AIOps in Action: Incident Prediction and Root Cause Automation

Polska - AIOps in Action: Incident Prediction and Root Cause Automation

United Kingdom - AIOps in Action: Incident Prediction and Root Cause Automation

South Korea - AIOps in Action: Incident Prediction and Root Cause Automation

Pakistan - AIOps in Action: Incident Prediction and Root Cause Automation

Sri Lanka - AIOps in Action: Incident Prediction and Root Cause Automation

Bulgaria - AIOps in Action: Incident Prediction and Root Cause Automation

Bolivia - AIOps in Action: Incident Prediction and Root Cause Automation

Indonesia - AIOps in Action: Incident Prediction and Root Cause Automation

Kazakhstan - AIOps in Action: Incident Prediction and Root Cause Automation

Moldova - AIOps in Action: Incident Prediction and Root Cause Automation

Morocco - AIOps in Action: Incident Prediction and Root Cause Automation

Tunisia - AIOps in Action: Incident Prediction and Root Cause Automation

Kuwait - AIOps in Action: Incident Prediction and Root Cause Automation

Oman - AIOps in Action: Incident Prediction and Root Cause Automation

Slovakia - AIOps in Action: Incident Prediction and Root Cause Automation

Kenya - AIOps in Action: Incident Prediction and Root Cause Automation

Nigeria - AIOps in Action: Incident Prediction and Root Cause Automation

Botswana - AIOps in Action: Incident Prediction and Root Cause Automation

Slovenia - AIOps in Action: Incident Prediction and Root Cause Automation

Croatia - AIOps in Action: Incident Prediction and Root Cause Automation

Serbia - AIOps in Action: Incident Prediction and Root Cause Automation

Bhutan - AIOps in Action: Incident Prediction and Root Cause Automation

Nepal - AIOps in Action: Incident Prediction and Root Cause Automation

Uzbekistan - AIOps in Action: Incident Prediction and Root Cause Automation