Course Code: bdhat
Duration: 28 hours
Prerequisites:

Kurs ten jest sugerowany dla wszystkich analityków danych, analityków biznesowych, programistów i administratorów, którzy mają doświadczenie z SQL lub/i językami skryptowymi. Przed tym szkoleniem nie jest wymagana wiedza na temat Apache Hadoop.

Overview:

Big Data Analyst Training to praktyczny kurs, który polecany jest każdemu, kto chce w przyszłości zostać ekspertem Data Scientist. Kurs skupia sie na aspektach potrzebnych do pracy nowoczesnego analityka w technologii Big Data. W trakcie kursu prezentowane są narzędzia pozwalające na uzyskanie dostępu, zmianę, transformację i analizę skomplikowanych struktur danych umieszczonych w klastrze Hadoop. W trakcie kursu będą poruszane tematy w ramach technologii Hadoop Ecosystem (Pig, Hive, Impala, ELK i inne).

  • Funkcjonaloność narzędzi Pig, Hive, Impala, ELK, pozwalające na zbieranie danych, zapisywanie wyników i analitykę.
  • Jak Pig, Hive i Impala mogą podnieść wydajność typowych i codziennych zadań analitycznych.
  • Wykonywanie w czasie rzeczywistym interaktywnych analiz ogromnych zbiorów danych aby uzyskać cenne i wartościowe elementy dla biznesu oraz jak interpretować wnioski.
  • Wykonywanie złożonych zapytań na bardzo dużych wolumenach danych.
Course Outline:

Podstawy Hadoop.

Wprowadzenie do Pig.

Podstawowa analiza danych z wykorzystaniem narzędzia Pig.

Procesowanie złożonych danych z Pig.

Operacje na wielu zbiorach danych z wykorzytaniem Pig.

Rozwiązywanie problemów i optymalizacja Pig.

Wprowadzenie do Hive, Impala, ELK.

Wykonywanie zapytań w Hive, Impala, ELK.

Zarządzanie danymi w Hive.

Przechowywanie danych i wydajność.

Analizy z wykorzystaniem narzędzi Hive i Impala.

Praca z narzędziem Impala i ELK.

Analiza tekstu i złożonych typów danych.

Optymalizacja Hive, Pig, Impala, ELK.

Interoperacyjność i przepływ pracy.

Pytania, zadania, certyfikacja.

Sites Published:

Polska - Big Data Hadoop Analyst Training