Wymagania
Podstawy programowania w dowolnym języku.
Charakterystyka i cel kursu
Celem kursu jest zapoznanie uczestników z procesem eksploracji danych. Poznasz podstawy dotyczące wybierania i reprezentacji danych, tworzenia modeli uczenia maszynowego a następnie oceny ich skuteczności. Abyś mógł utrwalić wiedzę i łatwiej zastosować ją po szkoleniu przygotowaliśmy ćwiczenia do wybranych zagadnień.
Plan szkolenia
-
Wprowadzenie do zagadnień nauki o danych
-
Co to jest Artificial Intelligence, Data Mining i Machine Learning
-
Obszary zastosowań sztucznej inteligencji, eksploracji danych i uczenia maszynowego
-
Eksploracja danych w procesie CRISP-DM
-
Krótki przegląd dostępnych rozwiązań darmowych i komercyjnych
-
Wiedza i dane konieczne w procesie budowania modeli Machine Learning
-
-
Zrozumienie uwarunkowań biznesowych i danych
-
Proces oceny wykonalności i założenia PoC
-
Dostępne źródła wiedzy odnośnie dostępnych rozwiązań
-
Pozyskiwanie danych
-
Wstępna analiza danych
-
Klasyfikacja metod eksploracji danych: predykcja, klasyfikacja, klastrowanie
-
-
Pierwszy model uczenia maszynowego (z ćwiczeniami)
-
Predykcja w oparciu o regresję liniową (Linear Regression)
-
Wybór i reprezentacja cech (Feature Extraction, Feature Selection)
-
Sposób powstawania modelu
-
Ocena dopasowania modelu
-
Jakie pułapki mogą się pojawić
-
-
Wprowadzenie do metod uczenia nadzorowanego (z ćwiczeniami)
-
Regresja logistyczna (Logistic Regression)
-
K najbliższych sąsiadów (k-nn)
-
Naiwny klasyfikator bayesowski
-
Maszyna wektorów nośnych (SVM)
-
-
Wprowadzenie do metod uczenia nienadzorowanego (z ćwiczeniami)
-
Klastrowanie (Clustering)
-
Wykrywanie anomalii (Anomaly detection)
-
-
Sieci neuronowe w uczeniu nadzorowanym i nienadzorowanym (z ćwiczeniami)
-
Idea i budowa sieci neuronowej (artificial neural networks)
-
Dlaczego sieci neuronowe mogą okazać się najskuteczniejszym z algorytmów
-
Przegląd najpopularniejszych rodzajów sieci
-
Jak uczy się sieć (funkcje aktywacji i oceny błędu, propagacja wsteczna)
-
Sieci neuronowe w uczeniu nadzorowanym
-
Sieci neuronowe w uczeniu nienadzorowanym
-
-
Ocena i wybór modelu (z ćwiczeniami)
-
Walidacja krzyżowa (Cross-validation)
-
Macierz wyniku działania modelu (Confusion matrix)
-
Interpretacja wartości recall (wyszukanie) i precision (precyzja)
-
Miara F1 (F1 measure/score)
-
-
Co dalej
-
Inne popularne algorytmy
-
Kierunki rozwoju
-
Polecane materiały
-