Spark for Developers ( sparkdev | 21 hours )

Prerequisites:

WYMAGANIA WSTĘPNE

znajomość języka Java / Scala / Python (nasze laboratoria w Scala i Pythonie) podstawowa znajomość środowiska programistycznego Linux (nawigacja w wierszu poleceń / edycja plików za pomocą VI lub nano)

Overview:

CEL:

Ten kurs wprowadzi Apache Spark. Studenci dowiedzą się, jak  Spark pasuje  do ekosystemu Big Data i jak używać Spark do analizy danych.  Kurs obejmuje powłokę Spark do interaktywnej analizy danych, elementy wewnętrzne Spark, interfejsy API Spark, Spark SQL, przesyłanie strumieniowe Spark oraz uczenie maszynowe i graphX.

AUDIENCJA :

Programiści / analitycy danych

Course Outline:
    Podstawa Scala Szybkie wprowadzenie do Scala Labs: Poznanie podstaw Scala Spark Tło i historia Spark i Hadoop Koncepcje i architektura Spark Eco system Spark (core, spark sql, mlib, streaming) Labs: Instalowanie i uruchamianie Sparka Pierwsze spojrzenie na Sparka Działającego Sparka tryb lokalny Spark web UI Spark Shell Analiza zbioru danych – część 1 Inspekcja RDD Laboratoria: Eksploracja powłoki Spark RDD Koncepcje RDD Partycje RDD Operacje / transformacje Typy RDD Para klucz-wartość RDD MapReduce na RDD Buforowanie i trwałość Laboratoria: tworzenie i sprawdzanie RDD; Buforowanie RDD Programowanie Spark API Wprowadzenie do Spark API / RDD API Przesyłanie pierwszego programu do Spark Debugowanie / logowanie Właściwości konfiguracyjne Laboratoria: Programowanie w Spark API, Przesyłanie zadań Obsługa Spark SQL SQL w Spark Dataframes Definiowanie tabel i importowanie zbiorów danych Wykonywanie zapytań o dane ramki przy użyciu SQL Formatów przechowywania: JSON / Parquet Labs: Tworzenie i wysyłanie zapytań do ramek danych; ocenianie formatów danych MLlib Wprowadzenie do MLlib Algorytmy MLlib Laboratoria: Pisanie aplikacji MLib GraphX Przegląd bibliotek GraphX Laboratoria GraphX API: Przetwarzanie danych wykresów za pomocą Spark Spark Streaming Przegląd przesyłania strumieniowego Ocena platform przesyłania strumieniowego Operacje strumieniowe Operacje w przesuwanych oknach Laboratoria: Pisanie aplikacji do strumieniowego przesyłania strumieniowego Spark i Hadoop Hadoop Wprowadzenie ( HDFS / YARN) Architektura Hadoop + Spark Uruchamianie Spark na Hadoop YARN Przetwarzanie plików HDFS przy użyciu Spark Spark Wydajność i strojenie Zmienne rozgłoszeniowe Akumulatory Zarządzanie pamięcią i buforowanie Operacje Spark Wdrażanie Spark w środowisku produkcyjnym Przykładowe szablony wdrożeń Konfiguracje Monitorowanie Rozwiązywanie problemów
Sites Published:

United Arab Emirates - Spark for Developers

Qatar - Spark for Developers

Egypt - Spark for Developers

Saudi Arabia - Spark for Developers

South Africa - Spark for Developers

Brasil - Spark para Developers

Canada - Spark for Developers

中国 - Spark for Developers

香港 - Spark for Developers

澳門 - Spark for Developers

台灣 - Spark for Developers

USA - Spark for Developers

Österreich - Spark for Developers

Schweiz - Spark for Developers

Deutschland - Spark for Developers

Czech Republic - Spark for Developers

Denmark - Spark for Developers

Estonia - Spark for Developers

Finland - Spark for Developers

Greece - Spark for Developers

Magyarország - Spark for Developers

Ireland - Spark for Developers

Luxembourg - Spark for Developers

Latvia - Spark for Developers

España - Spark para Desarrolladores

Italia - Spark for Developers

Lithuania - Spark for Developers

Nederland - Spark for Developers

Norway - Spark for Developers

Portugal - Spark para Developers

România - Spark for Developers

Sverige - Spark for Developers

Türkiye - Spark for Developers

Malta - Spark for Developers

Belgique - Spark for Developers

France - Spark for Developers

日本 - Spark for Developers

Australia - Spark for Developers

Malaysia - Spark for Developers

New Zealand - Spark for Developers

Philippines - Spark for Developers

Singapore - Spark for Developers

Thailand - Spark for Developers

Vietnam - Spark for Developers

India - Spark for Developers

Argentina - Spark para Desarrolladores

Chile - Spark para Desarrolladores

Costa Rica - Spark para Desarrolladores

Ecuador - Spark para Desarrolladores

Guatemala - Spark para Desarrolladores

Colombia - Spark para Desarrolladores

México - Spark para Desarrolladores

Panama - Spark para Desarrolladores

Peru - Spark para Desarrolladores

Uruguay - Spark para Desarrolladores

Venezuela - Spark para Desarrolladores

Polska - Spark for Developers

United Kingdom - Spark for Developers

South Korea - Spark for Developers

Pakistan - Spark for Developers

Sri Lanka - Spark for Developers

Bulgaria - Spark for Developers

Bolivia - Spark para Desarrolladores

Indonesia - Spark for Developers

Kazakhstan - Spark for Developers

Moldova - Spark for Developers

Morocco - Spark for Developers

Tunisia - Spark for Developers

Kuwait - Spark for Developers

Oman - Spark for Developers

Slovakia - Spark for Developers

Kenya - Spark for Developers

Nigeria - Spark for Developers

Botswana - Spark for Developers

Slovenia - Spark for Developers

Croatia - Spark for Developers

Serbia - Spark for Developers

Bhutan - Spark for Developers

Nepal - Spark for Developers