- Doświadczenie z Python Programming.
- Doświadczenie z wierszem poleceń Linux.
Publiczność
- Programiści
Apache Beam to otwarty, zunifikowany model programowania do definiowania i wykonywania równoległych potoków przetwarzania danych. Jego moc polega na możliwości uruchamiania zarówno potoków wsadowych, jak i strumieniowych, przy czym wykonanie jest przeprowadzane przez jeden z obsługiwanych przez Beam back-endów przetwarzania rozproszonego: Apache Apex, Apache Flink, Apache Spark i Google Cloud Dataflow. Rozwiązanie Apache Beam jest przydatne w zadaniach ETL (Extract, Transform, and Load), takich jak przenoszenie danych między różnymi nośnikami pamięci i źródłami danych, przekształcanie danych w bardziej pożądany format i ładowanie danych do nowego systemu.
W tym prowadzonym przez instruktora szkoleniu na żywo (na miejscu lub zdalnie) uczestnicy dowiedzą się, jak zaimplementować Apache Beam SDK w aplikacji Java lub Python, która definiuje potok przetwarzania danych w celu dekompozycji dużego zbioru danych na mniejsze fragmenty w celu niezależnego, równoległego przetwarzania.
Pod koniec tego szkolenia uczestnicy będą mogli
- Zainstalować i skonfigurować Apache Beam.
- Używać pojedynczego modelu programowania do przeprowadzania zarówno przetwarzania wsadowego, jak i strumieniowego z poziomu aplikacji Java lub Python.
- Wykonywać potoki w wielu środowiskach.
Format kursu
- Wykład częściowy, dyskusja częściowa, ćwiczenia i ciężka praktyka praktyczna
Uwaga
- Ten kurs będzie dostępny Scala w przyszłości. Prosimy o kontakt w celu ustalenia szczegółów.
Wprowadzenie
- Apache Beam vs MapReduce, Spark Streaming, Kafka Streaming, Storm i Flink
Instalacja i konfiguracja Apache Beam
Przegląd funkcji i architektury Apache Beam
- Model Beam, zestawy SDK, narzędzia Beam Pipeline Runners
- Zaplecze przetwarzania rozproszonego
Zrozumienie modelu Apache Beam Programming
- Jak wykonywany jest potok
Uruchamianie przykładowego potoku
- Przygotowanie potoku Word
- Wykonywanie potoku lokalnie
Projektowanie potoku
- Planowanie struktury, wybieranie przekształceń oraz określanie metod wejściowych i wyjściowych
Tworzenie potoku
- Pisanie programu sterownika i definiowanie potoku
- Korzystanie z klas Apache Beam
- Zestawy danych, transformacje, wejścia/wyjścia, kodowanie danych itp.
Wykonywanie potoku
- Wykonywanie potoku lokalnie, na maszynach zdalnych i w chmurze publicznej
- Wybór programu uruchamiającego
- Konfiguracje specyficzne dla runnera
Testowanie i debugowanie Apache Beam
- Korzystanie z podpowiedzi dotyczących typów w celu emulacji statycznego wpisywania
- Zarządzanie zależnościami potoku Python
Przetwarzanie ograniczonych i nieograniczonych zestawów danych
- Okna i wyzwalacze
Tworzenie potoków wielokrotnego użytku i łatwych w utrzymaniu
Tworzenie nowych źródeł i zlewów danych
- Interfejs API źródła i zlewu Apache Beam
Integracja Apache Beam z innymi Big Data systemami
- Apache Hadoop, Apache Spark, Apache Kafka
Rozwiązywanie problemów
Podsumowanie i wnioski
United Arab Emirates - Unified Batch and Stream Processing with Apache Beam
Qatar - Unified Batch and Stream Processing with Apache Beam
Egypt - Unified Batch and Stream Processing with Apache Beam
Saudi Arabia - Unified Batch and Stream Processing with Apache Beam
South Africa - Unified Batch and Stream Processing with Apache Beam
Brasil - Unified Batch and Stream Processing with Apache Beam
Canada - Unified Batch and Stream Processing with Apache Beam
中国 - Unified Batch and Stream Processing with Apache Beam
香港 - Unified Batch and Stream Processing with Apache Beam
澳門 - Unified Batch and Stream Processing with Apache Beam
台灣 - Unified Batch and Stream Processing with Apache Beam
USA - Unified Batch and Stream Processing with Apache Beam
Österreich - Unified Batch and Stream Processing with Apache Beam
Schweiz - Unified Batch and Stream Processing with Apache Beam
Deutschland - Unified Batch and Stream Processing with Apache Beam
Czech Republic - Unified Batch and Stream Processing with Apache Beam
Denmark - Unified Batch and Stream Processing with Apache Beam
Estonia - Unified Batch and Stream Processing with Apache Beam
Finland - Unified Batch and Stream Processing with Apache Beam
Greece - Unified Batch and Stream Processing with Apache Beam
Magyarország - Unified Batch and Stream Processing with Apache Beam
Ireland - Unified Batch and Stream Processing with Apache Beam
Luxembourg - Unified Batch and Stream Processing with Apache Beam
Latvia - Unified Batch and Stream Processing with Apache Beam
España - Unified Batch and Stream Processing with Apache Beam
Italia - Unified Batch and Stream Processing with Apache Beam
Lithuania - Unified Batch and Stream Processing with Apache Beam
Nederland - Unified Batch and Stream Processing with Apache Beam
Norway - Unified Batch and Stream Processing with Apache Beam
Portugal - Unified Batch and Stream Processing with Apache Beam
România - Unified Batch and Stream Processing with Apache Beam
Sverige - Unified Batch and Stream Processing with Apache Beam
Türkiye - Unified Batch and Stream Processing with Apache Beam
Malta - Unified Batch and Stream Processing with Apache Beam
Belgique - Unified Batch and Stream Processing with Apache Beam
France - Unified Batch and Stream Processing with Apache Beam
日本 - Unified Batch and Stream Processing with Apache Beam
Australia - Unified Batch and Stream Processing with Apache Beam
Malaysia - Unified Batch and Stream Processing with Apache Beam
New Zealand - Unified Batch and Stream Processing with Apache Beam
Philippines - Unified Batch and Stream Processing with Apache Beam
Singapore - Unified Batch and Stream Processing with Apache Beam
Thailand - Unified Batch and Stream Processing with Apache Beam
Vietnam - Unified Batch and Stream Processing with Apache Beam
India - Unified Batch and Stream Processing with Apache Beam
Argentina - Unified Batch and Stream Processing with Apache Beam
Chile - Unified Batch and Stream Processing with Apache Beam
Costa Rica - Unified Batch and Stream Processing with Apache Beam
Ecuador - Unified Batch and Stream Processing with Apache Beam
Guatemala - Unified Batch and Stream Processing with Apache Beam
Colombia - Unified Batch and Stream Processing with Apache Beam
México - Unified Batch and Stream Processing with Apache Beam
Panama - Unified Batch and Stream Processing with Apache Beam
Peru - Unified Batch and Stream Processing with Apache Beam
Uruguay - Unified Batch and Stream Processing with Apache Beam
Venezuela - Unified Batch and Stream Processing with Apache Beam
Polska - Unified Batch and Stream Processing with Apache Beam
United Kingdom - Unified Batch and Stream Processing with Apache Beam
South Korea - Unified Batch and Stream Processing with Apache Beam
Pakistan - Unified Batch and Stream Processing with Apache Beam
Sri Lanka - Unified Batch and Stream Processing with Apache Beam
Bulgaria - Unified Batch and Stream Processing with Apache Beam
Bolivia - Unified Batch and Stream Processing with Apache Beam
Indonesia - Unified Batch and Stream Processing with Apache Beam
Kazakhstan - Unified Batch and Stream Processing with Apache Beam
Moldova - Unified Batch and Stream Processing with Apache Beam
Morocco - Unified Batch and Stream Processing with Apache Beam
Tunisia - Unified Batch and Stream Processing with Apache Beam
Kuwait - Unified Batch and Stream Processing with Apache Beam
Oman - Unified Batch and Stream Processing with Apache Beam
Slovakia - Unified Batch and Stream Processing with Apache Beam
Kenya - Unified Batch and Stream Processing with Apache Beam
Nigeria - Unified Batch and Stream Processing with Apache Beam
Botswana - Unified Batch and Stream Processing with Apache Beam
Slovenia - Unified Batch and Stream Processing with Apache Beam
Croatia - Unified Batch and Stream Processing with Apache Beam
Serbia - Unified Batch and Stream Processing with Apache Beam
Bhutan - Unified Batch and Stream Processing with Apache Beam
Nepal - Unified Batch and Stream Processing with Apache Beam
Uzbekistan - Unified Batch and Stream Processing with Apache Beam