Course Code: apacheh
Duration: 35 hours
Prerequisites:
  • Podstawowe umiejętności administracji systemem Linux
  • Podstawowe umiejętności programistyczne
Overview:

Głównym celem szkolenia jest zdobycie wiedzy z administracji systemem Apache Hadoop w środowiskach MapReduce oraz YARN na poziomie zaawansowanym. Tematyka szkolenia dotyczy w głównej mierze architektury systemu Hadoop, a w szczególności systemu plików HDFS oraz modeli programistycznych MapReduce i YARN oraz zagadnień związanych z planowaniem, instalacją, konfiguracją, administracją, zarządzaniem i monitorowaniem klastra systemu Hadoop. Pozostałe zagadnienia związane z tematyką BigData takie jak HBase, Cassandra, Impala, Pig, Hiver oraz Sqoop są również omówione, choć pobieżnie. Kurs przeznaczony jest w głównej mierze do specjalistów z branży IT, którzy chcą przygotować się i zdać egzamin CCAH (Cloudera Certified administrator for Apache Hadoop).

Course Outline:

1: HDFS (17%)

  • Funkcje poszczególnych daemonów systemu Apache Hadoop

  • Przechowywanie i przetwarzanie danych w sytemie Hadoop

  • W jakich okolicznościach powinniśmy wybrać system Hadoop

  • Architektura i zasada działania HDFS

  • Federacje HDFS

  • HDFS High Availability

  • Bezpieczeństwo HDFS (Kerberos)

  • Studiowanie przypadków

  • Proces odczytu i zapisu plików w HDFS

  • Interfejsk tekstowy HDFS

2: YARN i MapReduce w wersji 2 (MRv2) (17%):

  • Konfiguracja YARN

  • Wdrażanie YARN

  • Architektura i zasada działania YARN

  • Alokacja zasobów w YARN

  • Przebieg wykonania zadań w YARN

  • Migracja z MRv1 do YARN

3: Planowanie Klastra Systemu Hadoop (16%)

  • Analiza wymagań i wybór sprzętu

  • Analiza wymagań i wybór systemu operacyjnego

  • Dobór parametrów jądra i konfiguracji pamięci masowej

  • Dobór konfiguracji sprzętowej do wymagań

  • Dobór podzespołów klastra i narzędzi pomocniczych

  • Skalowalność systemu: obciążenie procesora, pamięci operacyjnej, pamięci masowej (IO) oraz pojemności systemu

  • Skalowalność na poziomie pamięci masowej: JBOD vs RAID, dyski sieciowe i wpływ wirtualizacji na wydajność systemu

  • Topologie sieciowe: obiążenie sieci w systemie Hadoop (HDFS i MapReduce) i optymalizacja połączeń

4: Instalacja i Administracja Klastrem Systemu Hadoop (25%)

  • Wpływ awari na działanie klastra

  • Monitorowanie logów

  • Podstawowe metryki wykorzystywane przez klaster systemu Hadoop

  • Narzędzia do monitorowania klastra systemu Hadoop

  • Narzędzia pomocnicze: Impala, Flume, Oozie, Hue, Cloudera Manager, Sqoop, Hive, Pig i inne

  • Narzędzia do administracji klastrem systemu Hadoop

5: Zarządzanie Zasobami (10%)

  • Architektura i funkcje kolejek

  • Alokacja zasobów przez kolejki FIFO

  • Alokacja zasobów przez kolejki sprawiedliwe

  • Alokacja zasobów przez kolejki pojemnościowe

6: Monitorowanie i Logowanie (15%)

  • Monitorowanie metryk

  • Zarządzanie NameNodem i JobTrackerem z poziomu Web GUI

  • Jak monitorować daemony systemu Hadoop

  • Monitorowanie zużycia CPU na kluczowych serwerach w klastrze

  • Monitorowanie zużycia pamięci RAM i swap

  • Zarządzanie i przeglądanie logów

  • Interpretacja logów
Sites Published:

United Arab Emirates - Administrator Training for Apache Hadoop

Qatar - Administrator Training for Apache Hadoop

Egypt - Administrator Training for Apache Hadoop

Saudi Arabia - Administrator Training for Apache Hadoop

South Africa - Administrator Training for Apache Hadoop

Brasil - Treinamento de Administrador para Apache Hadoop

Canada - Administrator Training for Apache Hadoop

中国 - Administrator Training for Apache Hadoop

香港 - Administrator Training for Apache Hadoop

澳門 - Administrator Training for Apache Hadoop

台灣 - Administrator Training for Apache Hadoop

USA - Administrator Training for Apache Hadoop

Österreich - Administrator Training for Apache Hadoop

Schweiz - Administrator Training for Apache Hadoop

Deutschland - Administrator Training for Apache Hadoop

Czech Republic - Administrator Training for Apache Hadoop

Denmark - Administrator Training for Apache Hadoop

Estonia - Administrator Training for Apache Hadoop

Finland - Administrator Training for Apache Hadoop

Greece - Administrator Training for Apache Hadoop

Magyarország - Administrator Training for Apache Hadoop

Ireland - Administrator Training for Apache Hadoop

Luxembourg - Administrator Training for Apache Hadoop

Latvia - Administrator Training for Apache Hadoop

España - Capacitación de Administrador para Apache Hadoop

Italia - Administrator Training for Apache Hadoop

Lithuania - Administrator Training for Apache Hadoop

Nederland - Administrator Training for Apache Hadoop

Norway - Administrator Training for Apache Hadoop

Portugal - Treinamento de Administrador para Apache Hadoop

România - Administrator Training for Apache Hadoop

Sverige - Administrator Training for Apache Hadoop

Türkiye - Administrator Training for Apache Hadoop

Malta - Administrator Training for Apache Hadoop

Belgique - Administrator Training for Apache Hadoop

France - Administrator Training for Apache Hadoop

日本 - Administrator Training for Apache Hadoop

Australia - Administrator Training for Apache Hadoop

Malaysia - Administrator Training for Apache Hadoop

New Zealand - Administrator Training for Apache Hadoop

Philippines - Administrator Training for Apache Hadoop

Singapore - Administrator Training for Apache Hadoop

Thailand - Administrator Training for Apache Hadoop

Vietnam - Administrator Training for Apache Hadoop

India - Administrator Training for Apache Hadoop

Argentina - Capacitación de Administrador para Apache Hadoop

Chile - Capacitación de Administrador para Apache Hadoop

Costa Rica - Capacitación de Administrador para Apache Hadoop

Ecuador - Capacitación de Administrador para Apache Hadoop

Guatemala - Capacitación de Administrador para Apache Hadoop

Colombia - Capacitación de Administrador para Apache Hadoop

México - Capacitación de Administrador para Apache Hadoop

Panama - Capacitación de Administrador para Apache Hadoop

Peru - Capacitación de Administrador para Apache Hadoop

Uruguay - Capacitación de Administrador para Apache Hadoop

Venezuela - Capacitación de Administrador para Apache Hadoop

Polska - Administrator Training for Apache Hadoop

United Kingdom - Administrator Training for Apache Hadoop

South Korea - Administrator Training for Apache Hadoop

Pakistan - Administrator Training for Apache Hadoop

Sri Lanka - Administrator Training for Apache Hadoop

Bulgaria - Administrator Training for Apache Hadoop

Bolivia - Capacitación de Administrador para Apache Hadoop

Indonesia - Administrator Training for Apache Hadoop

Kazakhstan - Administrator Training for Apache Hadoop

Moldova - Administrator Training for Apache Hadoop

Morocco - Administrator Training for Apache Hadoop

Tunisia - Administrator Training for Apache Hadoop

Kuwait - Administrator Training for Apache Hadoop

Oman - Administrator Training for Apache Hadoop

Slovakia - Administrator Training for Apache Hadoop

Kenya - Administrator Training for Apache Hadoop

Nigeria - Administrator Training for Apache Hadoop

Botswana - Administrator Training for Apache Hadoop

Slovenia - Administrator Training for Apache Hadoop

Croatia - Administrator Training for Apache Hadoop

Serbia - Administrator Training for Apache Hadoop

Bhutan - Administrator Training for Apache Hadoop

Nepal - Administrator Training for Apache Hadoop

Uzbekistan - Administrator Training for Apache Hadoop