Course Code: beam
Duration: 14 hours
Prerequisites:
  • Doświadczenie z Python Programming.
  • Doświadczenie z wierszem poleceń Linux.

Publiczność

  • Programiści
Overview:

Apache Beam to otwarty, zunifikowany model programowania do definiowania i wykonywania równoległych potoków przetwarzania danych. Jego moc polega na możliwości uruchamiania zarówno potoków wsadowych, jak i strumieniowych, przy czym wykonanie jest przeprowadzane przez jeden z obsługiwanych przez Beam back-endów przetwarzania rozproszonego: Apache Apex, Apache Flink, Apache Spark i Google Cloud Dataflow. Rozwiązanie Apache Beam jest przydatne w zadaniach ETL (Extract, Transform, and Load), takich jak przenoszenie danych między różnymi nośnikami pamięci i źródłami danych, przekształcanie danych w bardziej pożądany format i ładowanie danych do nowego systemu.

W tym prowadzonym przez instruktora szkoleniu na żywo (na miejscu lub zdalnie) uczestnicy dowiedzą się, jak zaimplementować Apache Beam SDK w aplikacji Java lub Python, która definiuje potok przetwarzania danych w celu dekompozycji dużego zbioru danych na mniejsze fragmenty w celu niezależnego, równoległego przetwarzania.

Pod koniec tego szkolenia uczestnicy będą mogli

  • Zainstalować i skonfigurować Apache Beam.
  • Używać pojedynczego modelu programowania do przeprowadzania zarówno przetwarzania wsadowego, jak i strumieniowego z poziomu aplikacji Java lub Python.
  • Wykonywać potoki w wielu środowiskach.

Format kursu

  • Wykład częściowy, dyskusja częściowa, ćwiczenia i ciężka praktyka praktyczna

Uwaga

  • Ten kurs będzie dostępny Scala w przyszłości. Prosimy o kontakt w celu ustalenia szczegółów.
Course Outline:

Wprowadzenie

  • Apache Beam vs MapReduce, Spark Streaming, Kafka Streaming, Storm i Flink

Instalacja i konfiguracja Apache Beam

Przegląd funkcji i architektury Apache Beam

  • Model Beam, zestawy SDK, narzędzia Beam Pipeline Runners
  • Zaplecze przetwarzania rozproszonego

Zrozumienie modelu Apache Beam Programming

  • Jak wykonywany jest potok

Uruchamianie przykładowego potoku

  • Przygotowanie potoku Word
  • Wykonywanie potoku lokalnie

Projektowanie potoku

  • Planowanie struktury, wybieranie przekształceń oraz określanie metod wejściowych i wyjściowych

Tworzenie potoku

  • Pisanie programu sterownika i definiowanie potoku
  • Korzystanie z klas Apache Beam
  • Zestawy danych, transformacje, wejścia/wyjścia, kodowanie danych itp.

Wykonywanie potoku

  • Wykonywanie potoku lokalnie, na maszynach zdalnych i w chmurze publicznej
  • Wybór programu uruchamiającego
  • Konfiguracje specyficzne dla runnera

Testowanie i debugowanie Apache Beam

  • Korzystanie z podpowiedzi dotyczących typów w celu emulacji statycznego wpisywania
  • Zarządzanie zależnościami potoku Python

Przetwarzanie ograniczonych i nieograniczonych zestawów danych

  • Okna i wyzwalacze

Tworzenie potoków wielokrotnego użytku i łatwych w utrzymaniu

Tworzenie nowych źródeł i zlewów danych

  • Interfejs API źródła i zlewu Apache Beam

Integracja Apache Beam z innymi Big Data systemami

  • Apache Hadoop, Apache Spark, Apache Kafka

Rozwiązywanie problemów

Podsumowanie i wnioski

Sites Published:

United Arab Emirates - Unified Batch and Stream Processing with Apache Beam

Qatar - Unified Batch and Stream Processing with Apache Beam

Egypt - Unified Batch and Stream Processing with Apache Beam

Saudi Arabia - Unified Batch and Stream Processing with Apache Beam

South Africa - Unified Batch and Stream Processing with Apache Beam

Brasil - Unified Batch and Stream Processing with Apache Beam

Canada - Unified Batch and Stream Processing with Apache Beam

中国 - Unified Batch and Stream Processing with Apache Beam

香港 - Unified Batch and Stream Processing with Apache Beam

澳門 - Unified Batch and Stream Processing with Apache Beam

台灣 - Unified Batch and Stream Processing with Apache Beam

USA - Unified Batch and Stream Processing with Apache Beam

Österreich - Unified Batch and Stream Processing with Apache Beam

Schweiz - Unified Batch and Stream Processing with Apache Beam

Deutschland - Unified Batch and Stream Processing with Apache Beam

Czech Republic - Unified Batch and Stream Processing with Apache Beam

Denmark - Unified Batch and Stream Processing with Apache Beam

Estonia - Unified Batch and Stream Processing with Apache Beam

Finland - Unified Batch and Stream Processing with Apache Beam

Greece - Unified Batch and Stream Processing with Apache Beam

Magyarország - Unified Batch and Stream Processing with Apache Beam

Ireland - Unified Batch and Stream Processing with Apache Beam

Luxembourg - Unified Batch and Stream Processing with Apache Beam

Latvia - Unified Batch and Stream Processing with Apache Beam

España - Unified Batch and Stream Processing with Apache Beam

Italia - Unified Batch and Stream Processing with Apache Beam

Lithuania - Unified Batch and Stream Processing with Apache Beam

Nederland - Unified Batch and Stream Processing with Apache Beam

Norway - Unified Batch and Stream Processing with Apache Beam

Portugal - Unified Batch and Stream Processing with Apache Beam

România - Unified Batch and Stream Processing with Apache Beam

Sverige - Unified Batch and Stream Processing with Apache Beam

Türkiye - Unified Batch and Stream Processing with Apache Beam

Malta - Unified Batch and Stream Processing with Apache Beam

Belgique - Unified Batch and Stream Processing with Apache Beam

France - Unified Batch and Stream Processing with Apache Beam

日本 - Unified Batch and Stream Processing with Apache Beam

Australia - Unified Batch and Stream Processing with Apache Beam

Malaysia - Unified Batch and Stream Processing with Apache Beam

New Zealand - Unified Batch and Stream Processing with Apache Beam

Philippines - Unified Batch and Stream Processing with Apache Beam

Singapore - Unified Batch and Stream Processing with Apache Beam

Thailand - Unified Batch and Stream Processing with Apache Beam

Vietnam - Unified Batch and Stream Processing with Apache Beam

India - Unified Batch and Stream Processing with Apache Beam

Argentina - Unified Batch and Stream Processing with Apache Beam

Chile - Unified Batch and Stream Processing with Apache Beam

Costa Rica - Unified Batch and Stream Processing with Apache Beam

Ecuador - Unified Batch and Stream Processing with Apache Beam

Guatemala - Unified Batch and Stream Processing with Apache Beam

Colombia - Unified Batch and Stream Processing with Apache Beam

México - Unified Batch and Stream Processing with Apache Beam

Panama - Unified Batch and Stream Processing with Apache Beam

Peru - Unified Batch and Stream Processing with Apache Beam

Uruguay - Unified Batch and Stream Processing with Apache Beam

Venezuela - Unified Batch and Stream Processing with Apache Beam

Polska - Unified Batch and Stream Processing with Apache Beam

United Kingdom - Unified Batch and Stream Processing with Apache Beam

South Korea - Unified Batch and Stream Processing with Apache Beam

Pakistan - Unified Batch and Stream Processing with Apache Beam

Sri Lanka - Unified Batch and Stream Processing with Apache Beam

Bulgaria - Unified Batch and Stream Processing with Apache Beam

Bolivia - Unified Batch and Stream Processing with Apache Beam

Indonesia - Unified Batch and Stream Processing with Apache Beam

Kazakhstan - Unified Batch and Stream Processing with Apache Beam

Moldova - Unified Batch and Stream Processing with Apache Beam

Morocco - Unified Batch and Stream Processing with Apache Beam

Tunisia - Unified Batch and Stream Processing with Apache Beam

Kuwait - Unified Batch and Stream Processing with Apache Beam

Oman - Unified Batch and Stream Processing with Apache Beam

Slovakia - Unified Batch and Stream Processing with Apache Beam

Kenya - Unified Batch and Stream Processing with Apache Beam

Nigeria - Unified Batch and Stream Processing with Apache Beam

Botswana - Unified Batch and Stream Processing with Apache Beam

Slovenia - Unified Batch and Stream Processing with Apache Beam

Croatia - Unified Batch and Stream Processing with Apache Beam

Serbia - Unified Batch and Stream Processing with Apache Beam

Bhutan - Unified Batch and Stream Processing with Apache Beam

Nepal - Unified Batch and Stream Processing with Apache Beam

Uzbekistan - Unified Batch and Stream Processing with Apache Beam