Course Code: hadoopdeva
Duration: 21 hours
Prerequisites:
  • znajomość języka programowania Java (większość ćwiczeń programistycznych jest w języku java)
  • znajomość środowiska Linux (umiejętność nawigowania w wierszu polecenia Linux, edytowania plików za pomocą vi / nano)
  • podstawowa wiedza o Hadoop.

Środowisko laboratoryjne

Zero Install: Nie ma potrzeby instalowania oprogramowania hadoop na maszynach studentów! Dla studentów zostanie udostępniony działający klaster hadoop.

Studenci będą potrzebować następujących elementów

  • klienta SSH (Linux i Mac mają już klienty ssh, dla systemu Windows Putty jest polecany)
  • przeglądarki do dostępu do klastera. Polecamy przeglądarkę Firefox
Overview:

Apache Hadoop jest jednym z najpopularniejszych frameworków do przetwarzania danych na klasterach serwerów. Ten kurs zagłębia się w zarządzanie danymi w HDFS, zaawansowane techniki Pig, Hive oraz HBase. Te zaawansowane techniki programowania będą korzystne dla doświadczonych developerów Hadoop.

Grupa docelowa: developerzy

Czas trwania: trzy dni

Format: wykłady (50%) oraz praktyczne warsztaty (50%).

Course Outline:

Sekcja 1: Data Management w HDFS

  • Różne formaty danych (JSON / Avro / Parquet)
  • Schematy kompresji
  • Maskowanie danych
  • Ćwiczenia praktyczne: analizowanie różnych formatów danych; włączanie kompresji

Sekcja 2: Zaawansowany Pig

  • Funkcje zdefiniowane przez użytkownika
  • Wprowadzenie do bibliotek Pig (ElephantBird / Data-Fu)
  • Ładowanie skomplikowanych struktur danych za pomocą Pig
  • Optymalizacja Pig
  • Ćwiczenia praktyczne: zaawansowane skryptowanie Pig, analizowanie złożonych typów danych

Sekcja 3: Zaawansowany Hive

  • Funkcje zdefiniowane przez użytkownika
  • Kompresowane tabele
  • Optymalizacja wydajności Hive
  • Ćwiczenia praktyczne: tworzenie kompresowanych tabel, ocena formatów tabel i konfiguracji

Sekcja 4: Zaawansowany HBase

  • Zaawansowane modelowanie schematów
  • Kompresja
  • Wprowadzanie dużych ilości danych
  • Porównanie szerokich tabel i wysokich tabel
  • HBase i Pig
  • HBase i Hive
  • Optymalizacja wydajności HBase
  • Ćwiczenia praktyczne: optymalizacja HBase; dostęp do danych HBase z Pig i Hive; używanie Phoenix do modelowania danych
Sites Published:

United Arab Emirates - Advanced Hadoop for Developers

Qatar - Advanced Hadoop for Developers

Egypt - Advanced Hadoop for Developers

Saudi Arabia - Advanced Hadoop for Developers

South Africa - Advanced Hadoop for Developers

Brasil - Advanced Hadoop for Developers

Canada - Advanced Hadoop for Developers

中国 - Advanced Hadoop for Developers

香港 - Advanced Hadoop for Developers

澳門 - Advanced Hadoop for Developers

台灣 - Advanced Hadoop for Developers

USA - Advanced Hadoop for Developers

Österreich - Advanced Hadoop for Developers

Schweiz - Advanced Hadoop for Developers

Deutschland - Advanced Hadoop for Developers

Czech Republic - Advanced Hadoop for Developers

Denmark - Advanced Hadoop for Developers

Estonia - Advanced Hadoop for Developers

Finland - Advanced Hadoop for Developers

Greece - Advanced Hadoop for Developers

Magyarország - Advanced Hadoop for Developers

Ireland - Advanced Hadoop for Developers

Luxembourg - Advanced Hadoop for Developers

Latvia - Advanced Hadoop for Developers

España - Hadoop Avanzado para Desarrolladores

Italia - Advanced Hadoop for Developers

Lithuania - Advanced Hadoop for Developers

Nederland - Advanced Hadoop for Developers

Norway - Advanced Hadoop for Developers

Portugal - Advanced Hadoop for Developers

România - Advanced Hadoop for Developers

Sverige - Advanced Hadoop for Developers

Türkiye - Advanced Hadoop for Developers

Malta - Advanced Hadoop for Developers

Belgique - Hadoop pour Développeurs, niveau Acvancé

France - Hadoop pour Développeurs, niveau Acvancé

日本 - Advanced Hadoop for Developers

Australia - Advanced Hadoop for Developers

Malaysia - Advanced Hadoop for Developers

New Zealand - Advanced Hadoop for Developers

Philippines - Advanced Hadoop for Developers

Singapore - Advanced Hadoop for Developers

Thailand - Advanced Hadoop for Developers

Vietnam - Advanced Hadoop for Developers

India - Advanced Hadoop for Developers

Argentina - Hadoop Avanzado para Desarrolladores

Chile - Hadoop Avanzado para Desarrolladores

Costa Rica - Hadoop Avanzado para Desarrolladores

Ecuador - Hadoop Avanzado para Desarrolladores

Guatemala - Hadoop Avanzado para Desarrolladores

Colombia - Hadoop Avanzado para Desarrolladores

México - Hadoop Avanzado para Desarrolladores

Panama - Hadoop Avanzado para Desarrolladores

Peru - Hadoop Avanzado para Desarrolladores

Uruguay - Hadoop Avanzado para Desarrolladores

Venezuela - Hadoop Avanzado para Desarrolladores

Polska - Advanced Hadoop for Developers

United Kingdom - Advanced Hadoop for Developers

South Korea - Advanced Hadoop for Developers

Pakistan - Advanced Hadoop for Developers

Sri Lanka - Advanced Hadoop for Developers

Bulgaria - Advanced Hadoop for Developers

Bolivia - Hadoop Avanzado para Desarrolladores

Indonesia - Advanced Hadoop for Developers

Kazakhstan - Advanced Hadoop for Developers

Moldova - Advanced Hadoop for Developers

Morocco - Advanced Hadoop for Developers

Tunisia - Advanced Hadoop for Developers

Kuwait - Advanced Hadoop for Developers

Oman - Advanced Hadoop for Developers

Slovakia - Advanced Hadoop for Developers

Kenya - Advanced Hadoop for Developers

Nigeria - Advanced Hadoop for Developers

Botswana - Advanced Hadoop for Developers

Slovenia - Advanced Hadoop for Developers

Croatia - Advanced Hadoop for Developers

Serbia - Advanced Hadoop for Developers

Bhutan - Advanced Hadoop for Developers

Nepal - Advanced Hadoop for Developers

Uzbekistan - Advanced Hadoop for Developers