Course Code: sparkcloud
Duration: 21 hours
Prerequisites:

Umiejętność programowania (najlepiej w języku python, scala)

Podstawy SQL

Overview:

Krzywa uczenia się Apache Spark powoli rośnie na początku, wymaga dużo wysiłku, aby uzyskać pierwszy zwrot. Ten kurs ma na celu przeskoczenie pierwszej trudnej części. Po ukończeniu tego kursu uczestnicy zrozumieją podstawy Apache Spark , będą wyraźnie odróżniać RDD od DataFrame, nauczą się Pythona i Scala API, zrozumieją executory i zadania itp. Również zgodnie z najlepszymi praktykami, kurs ten silnie koncentruje się na wdrażaniu w chmurze, Databricks i AWS. Studenci zrozumieją również różnice między AWS EMR i AWS Glue, jedną z najnowszych usług Spark w AWS.  

AUDIENCJA:

Inżynier ds. danych, DevOps, Naukowiec ds. danych

Course Outline:

Wstęp:

  • Apache Spark w Hadoop Ekosystem
  • Krótkie wprowadzenie do Pythona, Scala

Podstawy (teoria):

  • Architektura
  • RDD
  • Transformacja i działania
  • Etap, zadanie, zależności

Korzystanie ze środowiska Databricks pozwala zrozumieć podstawy (warsztat praktyczny):

  • Ćwiczenia z wykorzystaniem RDD API
  • Podstawowe funkcje akcji i transformacji
  • ParaRDD
  • Dołączyć
  • Strategie buforowania
  • Ćwiczenia z wykorzystaniem DataFrame API
  • IskraSQL
  • DataFrame: wybierz, filtruj, grupuj, sortuj
  • UDF (funkcja zdefiniowana przez użytkownika)
  • Patrząc na API DataSet
  • Transmisja strumieniowa

Korzystanie ze środowiska AWS obejmuje zrozumienie wdrożenia (warsztat praktyczny):

  • Podstawy kleju AWS
  • Poznaj różnice między AWS EMR i AWS Glue
  • Przykładowe zadania w obu środowiskach
  • Zrozum zalety i wady

Dodatkowy:

  • Wprowadzenie do orkiestracji Apache Airflow.
Sites Published:

United Arab Emirates - Apache Spark in the Cloud

Qatar - Apache Spark in the Cloud

Egypt - Apache Spark in the Cloud

Saudi Arabia - Apache Spark in the Cloud

South Africa - Apache Spark in the Cloud

Brasil - Apache Spark in the Cloud

Canada - Apache Spark in the Cloud

中国 - Apache Spark in the Cloud

香港 - Apache Spark in the Cloud

澳門 - Apache Spark in the Cloud

台灣 - Apache Spark in the Cloud

USA - Apache Spark in the Cloud

Österreich - Apache Spark in the Cloud

Schweiz - Apache Spark in the Cloud

Deutschland - Apache Spark in the Cloud

Czech Republic - Apache Spark in the Cloud

Denmark - Apache Spark in the Cloud

Estonia - Apache Spark in the Cloud

Finland - Apache Spark in the Cloud

Greece - Apache Spark in the Cloud

Magyarország - Apache Spark in the Cloud

Ireland - Apache Spark in the Cloud

Luxembourg - Apache Spark in the Cloud

Latvia - Apache Spark in the Cloud

España - Apache Spark in the Cloud

Italia - Apache Spark in the Cloud

Lithuania - Apache Spark in the Cloud

Nederland - Apache Spark in the Cloud

Norway - Apache Spark in the Cloud

Portugal - Apache Spark in the Cloud

România - Apache Spark in the Cloud

Sverige - Apache Spark in the Cloud

Türkiye - Apache Spark in the Cloud

Malta - Apache Spark in the Cloud

Belgique - Apache Spark in the Cloud

France - Apache Spark in the Cloud

日本 - Apache Spark in the Cloud

Australia - Apache Spark in the Cloud

Malaysia - Apache Spark in the Cloud

New Zealand - Apache Spark in the Cloud

Philippines - Apache Spark in the Cloud

Singapore - Apache Spark in the Cloud

Thailand - Apache Spark in the Cloud

Vietnam - Apache Spark in the Cloud

India - Apache Spark in the Cloud

Argentina - Apache Spark in the Cloud

Chile - Apache Spark in the Cloud

Costa Rica - Apache Spark in the Cloud

Ecuador - Apache Spark in the Cloud

Guatemala - Apache Spark in the Cloud

Colombia - Apache Spark in the Cloud

México - Apache Spark in the Cloud

Panama - Apache Spark in the Cloud

Peru - Apache Spark in the Cloud

Uruguay - Apache Spark in the Cloud

Venezuela - Apache Spark in the Cloud

Polska - Apache Spark in the Cloud

United Kingdom - Apache Spark in the Cloud

South Korea - Apache Spark in the Cloud

Pakistan - Apache Spark in the Cloud

Sri Lanka - Apache Spark in the Cloud

Bulgaria - Apache Spark in the Cloud

Bolivia - Apache Spark in the Cloud

Indonesia - Apache Spark in the Cloud

Kazakhstan - Apache Spark in the Cloud

Moldova - Apache Spark in the Cloud

Morocco - Apache Spark in the Cloud

Tunisia - Apache Spark in the Cloud

Kuwait - Apache Spark in the Cloud

Oman - Apache Spark in the Cloud

Slovakia - Apache Spark in the Cloud

Kenya - Apache Spark in the Cloud

Nigeria - Apache Spark in the Cloud

Botswana - Apache Spark in the Cloud

Slovenia - Apache Spark in the Cloud

Croatia - Apache Spark in the Cloud

Serbia - Apache Spark in the Cloud

Bhutan - Apache Spark in the Cloud

Nepal - Apache Spark in the Cloud

Uzbekistan - Apache Spark in the Cloud