Umiejętność programowania (najlepiej w języku python, scala)
Podstawy SQL
Krzywa uczenia się Apache Spark powoli rośnie na początku, wymaga dużo wysiłku, aby uzyskać pierwszy zwrot. Ten kurs ma na celu przeskoczenie pierwszej trudnej części. Po ukończeniu tego kursu uczestnicy zrozumieją podstawy Apache Spark , będą wyraźnie odróżniać RDD od DataFrame, nauczą się Pythona i Scala API, zrozumieją executory i zadania itp. Również zgodnie z najlepszymi praktykami, kurs ten silnie koncentruje się na wdrażaniu w chmurze, Databricks i AWS. Studenci zrozumieją również różnice między AWS EMR i AWS Glue, jedną z najnowszych usług Spark w AWS.
AUDIENCJA:
Inżynier ds. danych, DevOps, Naukowiec ds. danych
Wstęp:
- Apache Spark w Hadoop Ekosystem
- Krótkie wprowadzenie do Pythona, Scala
Podstawy (teoria):
- Architektura
- RDD
- Transformacja i działania
- Etap, zadanie, zależności
Korzystanie ze środowiska Databricks pozwala zrozumieć podstawy (warsztat praktyczny):
- Ćwiczenia z wykorzystaniem RDD API
- Podstawowe funkcje akcji i transformacji
- ParaRDD
- Dołączyć
- Strategie buforowania
- Ćwiczenia z wykorzystaniem DataFrame API
- IskraSQL
- DataFrame: wybierz, filtruj, grupuj, sortuj
- UDF (funkcja zdefiniowana przez użytkownika)
- Patrząc na API DataSet
- Transmisja strumieniowa
Korzystanie ze środowiska AWS obejmuje zrozumienie wdrożenia (warsztat praktyczny):
- Podstawy kleju AWS
- Poznaj różnice między AWS EMR i AWS Glue
- Przykładowe zadania w obu środowiskach
- Zrozum zalety i wady
Dodatkowy:
- Wprowadzenie do orkiestracji Apache Airflow.
United Arab Emirates - Apache Spark in the Cloud
Qatar - Apache Spark in the Cloud
Egypt - Apache Spark in the Cloud
Saudi Arabia - Apache Spark in the Cloud
South Africa - Apache Spark in the Cloud
Brasil - Apache Spark in the Cloud
Canada - Apache Spark in the Cloud
中国 - Apache Spark in the Cloud
香港 - Apache Spark in the Cloud
澳門 - Apache Spark in the Cloud
台灣 - Apache Spark in the Cloud
USA - Apache Spark in the Cloud
Österreich - Apache Spark in the Cloud
Schweiz - Apache Spark in the Cloud
Deutschland - Apache Spark in the Cloud
Czech Republic - Apache Spark in the Cloud
Denmark - Apache Spark in the Cloud
Estonia - Apache Spark in the Cloud
Finland - Apache Spark in the Cloud
Greece - Apache Spark in the Cloud
Magyarország - Apache Spark in the Cloud
Ireland - Apache Spark in the Cloud
Luxembourg - Apache Spark in the Cloud
Latvia - Apache Spark in the Cloud
España - Apache Spark in the Cloud
Italia - Apache Spark in the Cloud
Lithuania - Apache Spark in the Cloud
Nederland - Apache Spark in the Cloud
Norway - Apache Spark in the Cloud
Portugal - Apache Spark in the Cloud
România - Apache Spark in the Cloud
Sverige - Apache Spark in the Cloud
Türkiye - Apache Spark in the Cloud
Malta - Apache Spark in the Cloud
Belgique - Apache Spark in the Cloud
France - Apache Spark in the Cloud
日本 - Apache Spark in the Cloud
Australia - Apache Spark in the Cloud
Malaysia - Apache Spark in the Cloud
New Zealand - Apache Spark in the Cloud
Philippines - Apache Spark in the Cloud
Singapore - Apache Spark in the Cloud
Thailand - Apache Spark in the Cloud
Vietnam - Apache Spark in the Cloud
India - Apache Spark in the Cloud
Argentina - Apache Spark in the Cloud
Chile - Apache Spark in the Cloud
Costa Rica - Apache Spark in the Cloud
Ecuador - Apache Spark in the Cloud
Guatemala - Apache Spark in the Cloud
Colombia - Apache Spark in the Cloud
México - Apache Spark in the Cloud
Panama - Apache Spark in the Cloud
Peru - Apache Spark in the Cloud
Uruguay - Apache Spark in the Cloud
Venezuela - Apache Spark in the Cloud
Polska - Apache Spark in the Cloud
United Kingdom - Apache Spark in the Cloud
South Korea - Apache Spark in the Cloud
Pakistan - Apache Spark in the Cloud
Sri Lanka - Apache Spark in the Cloud
Bulgaria - Apache Spark in the Cloud
Bolivia - Apache Spark in the Cloud
Indonesia - Apache Spark in the Cloud
Kazakhstan - Apache Spark in the Cloud
Moldova - Apache Spark in the Cloud
Morocco - Apache Spark in the Cloud
Tunisia - Apache Spark in the Cloud
Kuwait - Apache Spark in the Cloud
Oman - Apache Spark in the Cloud
Slovakia - Apache Spark in the Cloud
Kenya - Apache Spark in the Cloud
Nigeria - Apache Spark in the Cloud
Botswana - Apache Spark in the Cloud
Slovenia - Apache Spark in the Cloud
Croatia - Apache Spark in the Cloud
Serbia - Apache Spark in the Cloud
Bhutan - Apache Spark in the Cloud