Course Code: macge
Duration: 14 hours
Prerequisites:

Wymagania

Podstawy programowania w dowolnym języku.

Overview:

Charakterystyka i cel kursu

Celem kursu jest zapoznanie uczestników z procesem eksploracji danych. Poznasz podstawy dotyczące wybierania i reprezentacji danych, tworzenia modeli uczenia maszynowego a następnie oceny ich skuteczności. Abyś mógł utrwalić wiedzę i łatwiej zastosować ją po szkoleniu przygotowaliśmy ćwiczenia do wybranych zagadnień.

Course Outline:

Plan szkolenia

  1. Wprowadzenie do zagadnień nauki o danych

    1. Co to jest Artificial Intelligence, Data Mining i Machine Learning

    2. Obszary zastosowań sztucznej inteligencji, eksploracji danych i uczenia maszynowego

    3. Eksploracja danych w procesie CRISP-DM

    4. Krótki przegląd dostępnych rozwiązań darmowych i komercyjnych

    5. Wiedza i dane konieczne w procesie budowania modeli Machine Learning

  2. Zrozumienie uwarunkowań biznesowych i danych

    1. Proces oceny wykonalności i założenia PoC

    2. Dostępne źródła wiedzy odnośnie dostępnych rozwiązań

    3. Pozyskiwanie danych

    4. Wstępna analiza danych

    5. Klasyfikacja metod eksploracji danych: predykcja, klasyfikacja, klastrowanie

  3. Pierwszy model uczenia maszynowego (z ćwiczeniami)

    1. Predykcja w oparciu o regresję liniową (Linear Regression)

    2. Wybór i reprezentacja cech (Feature Extraction, Feature Selection)

    3. Sposób powstawania modelu

    4. Ocena dopasowania modelu

    5. Jakie pułapki mogą się pojawić

  4. Wprowadzenie do metod uczenia nadzorowanego (z ćwiczeniami)

    1. Regresja logistyczna (Logistic Regression) 

    2. K najbliższych sąsiadów (k-nn)

    3. Naiwny klasyfikator bayesowski

    4. Maszyna wektorów nośnych (SVM)

  5. Wprowadzenie do metod uczenia nienadzorowanego (z ćwiczeniami)

    1. Klastrowanie (Clustering)

    2. Wykrywanie anomalii (Anomaly detection)

  6. Sieci neuronowe w uczeniu nadzorowanym i nienadzorowanym (z ćwiczeniami)

    1. Idea i budowa sieci neuronowej (artificial neural networks)

    2. Dlaczego sieci neuronowe mogą okazać się najskuteczniejszym z  algorytmów

    3. Przegląd najpopularniejszych rodzajów sieci

    4. Jak uczy się sieć (funkcje aktywacji i oceny błędu, propagacja wsteczna)

    5. Sieci neuronowe w uczeniu nadzorowanym

    6. Sieci neuronowe w uczeniu nienadzorowanym

  7. Ocena i wybór modelu (z ćwiczeniami)

    1. Walidacja krzyżowa (Cross-validation)

    2. Macierz wyniku działania modelu (Confusion matrix)

    3. Interpretacja wartości recall (wyszukanie) i precision (precyzja)

    4. Miara F1 (F1 measure/score)

  8. Co dalej

    1. Inne popularne algorytmy

    2. Kierunki rozwoju

    3. Polecane materiały