Spark for Developers ( sparkdev | 21 hours )
WYMAGANIA WSTĘPNE
znajomość języka Java / Scala / Python (nasze laboratoria w Scala i Pythonie) podstawowa znajomość środowiska programistycznego Linux (nawigacja w wierszu poleceń / edycja plików za pomocą VI lub nano)
CEL:
Ten kurs wprowadzi Apache Spark. Studenci dowiedzą się, jak Spark pasuje do ekosystemu Big Data i jak używać Spark do analizy danych. Kurs obejmuje powłokę Spark do interaktywnej analizy danych, elementy wewnętrzne Spark, interfejsy API Spark, Spark SQL, przesyłanie strumieniowe Spark oraz uczenie maszynowe i graphX.
AUDIENCJA :
Programiści / analitycy danych
- Podstawa Scala Szybkie wprowadzenie do Scala Labs: Poznanie podstaw Scala Spark Tło i historia Spark i Hadoop Koncepcje i architektura Spark Eco system Spark (core, spark sql, mlib, streaming) Labs: Instalowanie i uruchamianie Sparka Pierwsze spojrzenie na Sparka Działającego Sparka tryb lokalny Spark web UI Spark Shell Analiza zbioru danych – część 1 Inspekcja RDD Laboratoria: Eksploracja powłoki Spark RDD Koncepcje RDD Partycje RDD Operacje / transformacje Typy RDD Para klucz-wartość RDD MapReduce na RDD Buforowanie i trwałość Laboratoria: tworzenie i sprawdzanie RDD; Buforowanie RDD Programowanie Spark API Wprowadzenie do Spark API / RDD API Przesyłanie pierwszego programu do Spark Debugowanie / logowanie Właściwości konfiguracyjne Laboratoria: Programowanie w Spark API, Przesyłanie zadań Obsługa Spark SQL SQL w Spark Dataframes Definiowanie tabel i importowanie zbiorów danych Wykonywanie zapytań o dane ramki przy użyciu SQL Formatów przechowywania: JSON / Parquet Labs: Tworzenie i wysyłanie zapytań do ramek danych; ocenianie formatów danych MLlib Wprowadzenie do MLlib Algorytmy MLlib Laboratoria: Pisanie aplikacji MLib GraphX Przegląd bibliotek GraphX Laboratoria GraphX API: Przetwarzanie danych wykresów za pomocą Spark Spark Streaming Przegląd przesyłania strumieniowego Ocena platform przesyłania strumieniowego Operacje strumieniowe Operacje w przesuwanych oknach Laboratoria: Pisanie aplikacji do strumieniowego przesyłania strumieniowego Spark i Hadoop Hadoop Wprowadzenie ( HDFS / YARN) Architektura Hadoop + Spark Uruchamianie Spark na Hadoop YARN Przetwarzanie plików HDFS przy użyciu Spark Spark Wydajność i strojenie Zmienne rozgłoszeniowe Akumulatory Zarządzanie pamięcią i buforowanie Operacje Spark Wdrażanie Spark w środowisku produkcyjnym Przykładowe szablony wdrożeń Konfiguracje Monitorowanie Rozwiązywanie problemów
United Arab Emirates - Spark for Developers
Saudi Arabia - Spark for Developers
South Africa - Spark for Developers
Brasil - Spark para Developers
Österreich - Spark for Developers
Schweiz - Spark for Developers
Deutschland - Spark for Developers
Czech Republic - Spark for Developers
Denmark - Spark for Developers
Estonia - Spark for Developers
Finland - Spark for Developers
Magyarország - Spark for Developers
Ireland - Spark for Developers
Luxembourg - Spark for Developers
España - Spark para Desarrolladores
Lithuania - Spark for Developers
Nederland - Spark for Developers
Portugal - Spark para Developers
România - Spark for Developers
Sverige - Spark for Developers
Türkiye - Spark for Developers
Belgique - Spark for Developers
Australia - Spark for Developers
Malaysia - Spark for Developers
New Zealand - Spark for Developers
Philippines - Spark for Developers
Singapore - Spark for Developers
Thailand - Spark for Developers
Vietnam - Spark for Developers
Argentina - Spark para Desarrolladores
Chile - Spark para Desarrolladores
Costa Rica - Spark para Desarrolladores
Ecuador - Spark para Desarrolladores
Guatemala - Spark para Desarrolladores
Colombia - Spark para Desarrolladores
México - Spark para Desarrolladores
Panama - Spark para Desarrolladores
Peru - Spark para Desarrolladores
Uruguay - Spark para Desarrolladores
Venezuela - Spark para Desarrolladores
United Kingdom - Spark for Developers
South Korea - Spark for Developers
Pakistan - Spark for Developers
Sri Lanka - Spark for Developers
Bulgaria - Spark for Developers
Bolivia - Spark para Desarrolladores
Indonesia - Spark for Developers
Kazakhstan - Spark for Developers
Moldova - Spark for Developers
Morocco - Spark for Developers
Tunisia - Spark for Developers
Slovakia - Spark for Developers
Nigeria - Spark for Developers
Botswana - Spark for Developers
Slovenia - Spark for Developers