Course Code: spmllib
Duration: 35 hours
Prerequisites:

Znajomość jednego z poniższych:

  • Java
  • Scala
  • Python
  • SparkR
Overview:

MLlib to biblioteka Spark’s do uczenia maszynowego (ML). Jej celem jest uczynienie praktycznego uczenia maszynowego skalowalnym i łatwym. Składa się z popularnych algorytmów uczenia się i narzędzi, w tym klasyfikacji, regresji, klastrowania, filtrowania opartego na współpracy, redukcji wymiarowości, a także prymitywów optymalizacji niższego poziomu i interfejsów API potoków wyższego poziomu.

Dzieli się na dwa pakiety:

  • spark.mllib zawiera oryginalny interfejs API zbudowany na bazie RDD.
  • spark.ml zapewnia API wyższego poziomu zbudowane na DataFrames do konstruowania potoków ML.

Publiczność

Ten kurs jest skierowany do inżynierów i programistów, którzy chcą korzystać z wbudowanej biblioteki maszynowej dla Apache Spark

Course Outline:

spark.mllib: typy danych, algorytmy i narzędzia

  • Typy danych
  • Podstawowe statystyki
    • statystyki podsumowujące
    • korelacje
    • próbkowanie warstwowe
    • testowanie hipotez
    • strumieniowe testowanie istotności
    • losowe generowanie danych
  • Klasyfikacja i regresja
    • modele liniowe (SVM, regresja logistyczna, regresja liniowa)
    • naiwny Bayes
    • drzewa decyzyjne
    • zespoły drzew (Random Forests i Gradient-Boosted Trees)
    • regresja izotoniczna
  • Filtrowanie oparte na współpracy
    • naprzemienne najmniejsze kwadraty (ALS)
  • Klasteryzacja
    • k-średnich
    • Mieszanka gaussowska
    • klastrowanie z iteracją mocy (PIC)
    • ukryta alokacja Dirichleta (LDA)
    • dwusieczna metoda k-średnich
    • k-średnich strumieniowych
  • Redukcja wymiarowości
    • dekompozycja wartości pojedynczej (SVD)
    • analiza składowych głównych (PCA)
  • Ekstrakcja i transformacja cech
  • Eksploracja częstych wzorców
    • Wzrost FP
    • reguły asocjacyjne
    • PrefixSpan
  • Metryki oceny
  • Eksport modelu PMML
  • Optymalizacja (deweloper)
    • stochastyczne zejście gradientowe
    • BFGS z ograniczoną pamięcią (L-BFGS)

spark.ml: API wysokiego poziomu dla potoków ML

  • Przegląd: estymatory, transformatory i potoki
  • Wyodrębnianie, przekształcanie i wybieranie cech
  • Klasyfikacja i regresja
  • Klasteryzacja
  • Tematy zaawansowane
Sites Published:

United Arab Emirates - Apache Spark MLlib

Qatar - Apache Spark MLlib

Egypt - Apache Spark MLlib

Saudi Arabia - Apache Spark MLlib

South Africa - Apache Spark MLlib

Brasil - Apache Spark MLlib

Canada - Apache Spark MLlib

中国 - Apache Spark MLlib

香港 - Apache Spark MLlib

澳門 - Apache Spark MLlib

台灣 - Apache Spark MLlib

USA - Apache Spark MLlib

Österreich - Apache Spark MLlib

Schweiz - Apache Spark MLlib

Deutschland - Apache Spark MLlib

Czech Republic - Apache Spark MLlib

Denmark - Apache Spark MLlib

Estonia - Apache Spark MLlib

Finland - Apache Spark MLlib

Greece - Apache Spark MLlib

Magyarország - Apache Spark MLlib

Ireland - Apache Spark MLlib

Luxembourg - Apache Spark MLlib

Latvia - Apache Spark MLlib

España - Apache Spark MLlib

Italia - Apache Spark MLlib

Lithuania - Apache Spark MLlib

Nederland - Apache Spark MLlib

Norway - Apache Spark MLlib

Portugal - Apache Spark MLlib

România - Apache Spark MLlib

Sverige - Apache Spark MLlib

Türkiye - Apache Spark MLlib

Malta - Apache Spark MLlib

Belgique - Apache Spark MLlib

France - Apache Spark MLlib

日本 - Apache Spark MLlib

Australia - Apache Spark MLlib

Malaysia - Apache Spark MLlib

New Zealand - Apache Spark MLlib

Philippines - Apache Spark MLlib

Singapore - Apache Spark MLlib

Thailand - Apache Spark MLlib

Vietnam - Apache Spark MLlib

India - Apache Spark MLlib

Argentina - Apache Spark MLlib

Chile - Apache Spark MLlib

Costa Rica - Apache Spark MLlib

Ecuador - Apache Spark MLlib

Guatemala - Apache Spark MLlib

Colombia - Apache Spark MLlib

México - Apache Spark MLlib

Panama - Apache Spark MLlib

Peru - Apache Spark MLlib

Uruguay - Apache Spark MLlib

Venezuela - Apache Spark MLlib

Polska - Apache Spark MLlib

United Kingdom - Apache Spark MLlib

South Korea - Apache Spark MLlib

Pakistan - Apache Spark MLlib

Sri Lanka - Apache Spark MLlib

Bulgaria - Apache Spark MLlib

Bolivia - Apache Spark MLlib

Indonesia - Apache Spark MLlib

Kazakhstan - Apache Spark MLlib

Moldova - Apache Spark MLlib

Morocco - Apache Spark MLlib

Tunisia - Apache Spark MLlib

Kuwait - Apache Spark MLlib

Oman - Apache Spark MLlib

Slovakia - Apache Spark MLlib

Kenya - Apache Spark MLlib

Nigeria - Apache Spark MLlib

Botswana - Apache Spark MLlib

Slovenia - Apache Spark MLlib

Croatia - Apache Spark MLlib

Serbia - Apache Spark MLlib

Bhutan - Apache Spark MLlib

Nepal - Apache Spark MLlib

Uzbekistan - Apache Spark MLlib