- znajomość języka programowania Java (większość ćwiczeń programistycznych jest w języku java)
- znajomość środowiska Linux (umiejętność nawigowania w wierszu polecenia Linux, edytowania plików za pomocą vi / nano)
- podstawowa wiedza o Hadoop.
Środowisko laboratoryjne
Zero Install: Nie ma potrzeby instalowania oprogramowania hadoop na maszynach studentów! Dla studentów zostanie udostępniony działający klaster hadoop.
Studenci będą potrzebować następujących elementów
- klienta SSH (Linux i Mac mają już klienty ssh, dla systemu Windows Putty jest polecany)
- przeglądarki do dostępu do klastera. Polecamy przeglądarkę Firefox
Apache Hadoop jest jednym z najpopularniejszych frameworków do przetwarzania danych na klasterach serwerów. Ten kurs zagłębia się w zarządzanie danymi w HDFS, zaawansowane techniki Pig, Hive oraz HBase. Te zaawansowane techniki programowania będą korzystne dla doświadczonych developerów Hadoop.
Grupa docelowa: developerzy
Czas trwania: trzy dni
Format: wykłady (50%) oraz praktyczne warsztaty (50%).
Sekcja 1: Data Management w HDFS
- Różne formaty danych (JSON / Avro / Parquet)
- Schematy kompresji
- Maskowanie danych
- Ćwiczenia praktyczne: analizowanie różnych formatów danych; włączanie kompresji
Sekcja 2: Zaawansowany Pig
- Funkcje zdefiniowane przez użytkownika
- Wprowadzenie do bibliotek Pig (ElephantBird / Data-Fu)
- Ładowanie skomplikowanych struktur danych za pomocą Pig
- Optymalizacja Pig
- Ćwiczenia praktyczne: zaawansowane skryptowanie Pig, analizowanie złożonych typów danych
Sekcja 3: Zaawansowany Hive
- Funkcje zdefiniowane przez użytkownika
- Kompresowane tabele
- Optymalizacja wydajności Hive
- Ćwiczenia praktyczne: tworzenie kompresowanych tabel, ocena formatów tabel i konfiguracji
Sekcja 4: Zaawansowany HBase
- Zaawansowane modelowanie schematów
- Kompresja
- Wprowadzanie dużych ilości danych
- Porównanie szerokich tabel i wysokich tabel
- HBase i Pig
- HBase i Hive
- Optymalizacja wydajności HBase
- Ćwiczenia praktyczne: optymalizacja HBase; dostęp do danych HBase z Pig i Hive; używanie Phoenix do modelowania danych
United Arab Emirates - Advanced Hadoop for Developers
Qatar - Advanced Hadoop for Developers
Egypt - Advanced Hadoop for Developers
Saudi Arabia - Advanced Hadoop for Developers
South Africa - Advanced Hadoop for Developers
Brasil - Advanced Hadoop for Developers
Canada - Advanced Hadoop for Developers
中国 - Advanced Hadoop for Developers
香港 - Advanced Hadoop for Developers
澳門 - Advanced Hadoop for Developers
台灣 - Advanced Hadoop for Developers
USA - Advanced Hadoop for Developers
Österreich - Advanced Hadoop for Developers
Schweiz - Advanced Hadoop for Developers
Deutschland - Advanced Hadoop for Developers
Czech Republic - Advanced Hadoop for Developers
Denmark - Advanced Hadoop for Developers
Estonia - Advanced Hadoop for Developers
Finland - Advanced Hadoop for Developers
Greece - Advanced Hadoop for Developers
Magyarország - Advanced Hadoop for Developers
Ireland - Advanced Hadoop for Developers
Luxembourg - Advanced Hadoop for Developers
Latvia - Advanced Hadoop for Developers
España - Hadoop Avanzado para Desarrolladores
Italia - Advanced Hadoop for Developers
Lithuania - Advanced Hadoop for Developers
Nederland - Advanced Hadoop for Developers
Norway - Advanced Hadoop for Developers
Portugal - Advanced Hadoop for Developers
România - Advanced Hadoop for Developers
Sverige - Advanced Hadoop for Developers
Türkiye - Advanced Hadoop for Developers
Malta - Advanced Hadoop for Developers
Belgique - Hadoop pour Développeurs, niveau Acvancé
France - Hadoop pour Développeurs, niveau Acvancé
日本 - Advanced Hadoop for Developers
Australia - Advanced Hadoop for Developers
Malaysia - Advanced Hadoop for Developers
New Zealand - Advanced Hadoop for Developers
Philippines - Advanced Hadoop for Developers
Singapore - Advanced Hadoop for Developers
Thailand - Advanced Hadoop for Developers
Vietnam - Advanced Hadoop for Developers
India - Advanced Hadoop for Developers
Argentina - Hadoop Avanzado para Desarrolladores
Chile - Hadoop Avanzado para Desarrolladores
Costa Rica - Hadoop Avanzado para Desarrolladores
Ecuador - Hadoop Avanzado para Desarrolladores
Guatemala - Hadoop Avanzado para Desarrolladores
Colombia - Hadoop Avanzado para Desarrolladores
México - Hadoop Avanzado para Desarrolladores
Panama - Hadoop Avanzado para Desarrolladores
Peru - Hadoop Avanzado para Desarrolladores
Uruguay - Hadoop Avanzado para Desarrolladores
Venezuela - Hadoop Avanzado para Desarrolladores
Polska - Advanced Hadoop for Developers
United Kingdom - Advanced Hadoop for Developers
South Korea - Advanced Hadoop for Developers
Pakistan - Advanced Hadoop for Developers
Sri Lanka - Advanced Hadoop for Developers
Bulgaria - Advanced Hadoop for Developers
Bolivia - Hadoop Avanzado para Desarrolladores
Indonesia - Advanced Hadoop for Developers
Kazakhstan - Advanced Hadoop for Developers
Moldova - Advanced Hadoop for Developers
Morocco - Advanced Hadoop for Developers
Tunisia - Advanced Hadoop for Developers
Kuwait - Advanced Hadoop for Developers
Oman - Advanced Hadoop for Developers
Slovakia - Advanced Hadoop for Developers
Kenya - Advanced Hadoop for Developers
Nigeria - Advanced Hadoop for Developers
Botswana - Advanced Hadoop for Developers
Slovenia - Advanced Hadoop for Developers
Croatia - Advanced Hadoop for Developers
Serbia - Advanced Hadoop for Developers
Bhutan - Advanced Hadoop for Developers