Znajomość jednego z poniższych:
- Java
- Scala
- Python
- SparkR
MLlib to biblioteka Spark’s do uczenia maszynowego (ML). Jej celem jest uczynienie praktycznego uczenia maszynowego skalowalnym i łatwym. Składa się z popularnych algorytmów uczenia się i narzędzi, w tym klasyfikacji, regresji, klastrowania, filtrowania opartego na współpracy, redukcji wymiarowości, a także prymitywów optymalizacji niższego poziomu i interfejsów API potoków wyższego poziomu.
Dzieli się na dwa pakiety:
- spark.mllib zawiera oryginalny interfejs API zbudowany na bazie RDD.
- spark.ml zapewnia API wyższego poziomu zbudowane na DataFrames do konstruowania potoków ML.
Publiczność
Ten kurs jest skierowany do inżynierów i programistów, którzy chcą korzystać z wbudowanej biblioteki maszynowej dla Apache Spark
spark.mllib: typy danych, algorytmy i narzędzia
- Typy danych
- Podstawowe statystyki
- statystyki podsumowujące
- korelacje
- próbkowanie warstwowe
- testowanie hipotez
- strumieniowe testowanie istotności
- losowe generowanie danych
- Klasyfikacja i regresja
- modele liniowe (SVM, regresja logistyczna, regresja liniowa)
- naiwny Bayes
- drzewa decyzyjne
- zespoły drzew (Random Forests i Gradient-Boosted Trees)
- regresja izotoniczna
- Filtrowanie oparte na współpracy
- naprzemienne najmniejsze kwadraty (ALS)
- Klasteryzacja
- k-średnich
- Mieszanka gaussowska
- klastrowanie z iteracją mocy (PIC)
- ukryta alokacja Dirichleta (LDA)
- dwusieczna metoda k-średnich
- k-średnich strumieniowych
- Redukcja wymiarowości
- dekompozycja wartości pojedynczej (SVD)
- analiza składowych głównych (PCA)
- Ekstrakcja i transformacja cech
- Eksploracja częstych wzorców
- Wzrost FP
- reguły asocjacyjne
- PrefixSpan
- Metryki oceny
- Eksport modelu PMML
- Optymalizacja (deweloper)
- stochastyczne zejście gradientowe
- BFGS z ograniczoną pamięcią (L-BFGS)
spark.ml: API wysokiego poziomu dla potoków ML
- Przegląd: estymatory, transformatory i potoki
- Wyodrębnianie, przekształcanie i wybieranie cech
- Klasyfikacja i regresja
- Klasteryzacja
- Tematy zaawansowane
United Arab Emirates - Apache Spark MLlib
Saudi Arabia - Apache Spark MLlib
South Africa - Apache Spark MLlib
Österreich - Apache Spark MLlib
Deutschland - Apache Spark MLlib
Czech Republic - Apache Spark MLlib
Magyarország - Apache Spark MLlib
Luxembourg - Apache Spark MLlib
Lithuania - Apache Spark MLlib
Nederland - Apache Spark MLlib
Australia - Apache Spark MLlib
New Zealand - Apache Spark MLlib
Philippines - Apache Spark MLlib
Singapore - Apache Spark MLlib
Argentina - Apache Spark MLlib
Costa Rica - Apache Spark MLlib
Guatemala - Apache Spark MLlib
Venezuela - Apache Spark MLlib
United Kingdom - Apache Spark MLlib
South Korea - Apache Spark MLlib
Sri Lanka - Apache Spark MLlib
Indonesia - Apache Spark MLlib