Course Code: hadoopsparkforadmin
Duration: 35 hours
Prerequisites:
  • Doświadczenie w administracji systemami
  • Doświadczenie z Linux wierszem poleceń
  • Zrozumienie koncepcji big data

Publiczność

  • Administratorzy systemu
  • Bazy danych
Overview:

Apache Hadoop jest popularnym frameworkiem do przetwarzania dużych zbiorów danych na wielu komputerach.

Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla administratorów systemów, którzy chcą dowiedzieć się, jak skonfigurować, wdrożyć i zarządzać klastrami Hadoop w swojej organizacji.

Po zakończeniu tego szkolenia uczestnicy będą w stanie

  • Instalowanie i konfigurowanie Apache Hadoop.
  • Zrozumienie czterech głównych komponentów ekosystemu Hadoop: HDFS, MapReduce, YARN i Hadoop Common.
  • Wykorzystanie rozproszonego systemu plików Hadoop (HDFS) do skalowania klastra do setek lub tysięcy węzłów;
  • Konfigurowanie HDFS do działania jako silnik pamięci masowej dla lokalnych wdrożeń Spark.
  • Konfiguracja Spark w celu uzyskania dostępu do alternatywnych rozwiązań pamięci masowej, takich jak Amazon S3 i systemy baz danych NoSQL, takie jak Redis, Elasticsearch, Couchbase, Aerospike itp.
  • Wykonywanie zadań administracyjnych, takich jak udostępnianie, zarządzanie, monitorowanie i zabezpieczanie klastra Apache Hadoop.

Format kursu

  • Interaktywny wykład i dyskusja.
  • Dużo ćwiczeń i praktyki.
  • Praktyczne wdrożenie w środowisku live-lab.

Opcje dostosowywania kursu

  • Aby zamówić niestandardowe szkolenie dla tego kursu, skontaktuj się z nami.
Course Outline:

Wprowadzenie

  • Wprowadzenie do rozwiązań Cloud Computing i Big Data
  • Przegląd funkcji i architektury Apache Hadoop

Konfiguracja Hadoop

  • Planowanie klastra Hadoop (lokalnego, w chmurze itp.)
  • Wybór systemu operacyjnego i dystrybucji Hadoop
  • Udostępnianie zasobów (sprzęt, sieć itp.)
  • Pobieranie i instalowanie oprogramowania
  • Dobór rozmiaru klastra pod kątem elastyczności

Praca z HDFS

  • Zrozumienie Hadoop rozproszonego systemu plików (HDFS)
  • Przegląd referencji poleceń HDFS
  • Dostęp do HDFS
  • Wykonywanie podstawowych operacji na plikach w HDFS
  • Używanie S3 jako uzupełnienia HDFS

Przegląd MapReduce

  • Zrozumienie przepływu danych w MapReduce Framework
  • Mapowanie, tasowanie, sortowanie i redukcja
  • Demo: Obliczanie najwyższych wynagrodzeń

Praca z YARN

  • Zrozumienie zarządzania zasobami w Hadoop
  • Praca z ResourceManager, NodeManager, Application Master
  • Planowanie zadań w YARN
  • Planowanie dla dużej liczby węzłów i klastrów
  • Demo: Planowanie zadań

Integracja Hadoop z aplikacją Spark

  • Konfigurowanie pamięci masowej dla Sparka (HDFS, Amazon, S3, NoSQL itp.)
  • Zrozumienie odpornych rozproszonych zbiorów danych (RDD)
  • Tworzenie RDD
  • Wdrażanie transformacji RDD
  • Demo: Wdrażanie programu wyszukiwania tekstów dla tytułów filmów

Zarządzanie klastrem Hadoop

  • Monitorowanie Hadoop
  • Zabezpieczanie klastra Hadoop
  • Dodawanie i usuwanie węzłów
  • Uruchamianie testu porównawczego wydajności
  • Dostrajanie klastra Hadoop w celu optymalizacji wydajności
  • Tworzenie kopii zapasowych, odzyskiwanie danych i planowanie ciągłości działania
  • Zapewnianie wysokiej dostępności (HA)

Aktualizacja i migracja klastra Hadoop

  • Ocena wymagań dotyczących obciążenia
  • Aktualizacja Hadoop
  • Przejście z wersji lokalnej do chmury i odwrotnie
  • Odzyskiwanie danych po awarii

Rozwiązywanie problemów

Podsumowanie i wnioski

Sites Published:

United Arab Emirates - Hadoop and Spark for Administrators

Qatar - Hadoop and Spark for Administrators

Egypt - Hadoop and Spark for Administrators

Saudi Arabia - Hadoop and Spark for Administrators

South Africa - Hadoop and Spark for Administrators

Brasil - Hadoop and Spark for Administrators

Canada - Hadoop and Spark for Administrators

中国 - Hadoop and Spark for Administrators

香港 - Hadoop and Spark for Administrators

澳門 - Hadoop and Spark for Administrators

台灣 - Hadoop and Spark for Administrators

USA - Hadoop and Spark for Administrators

Österreich - Hadoop and Spark for Administrators

Schweiz - Hadoop and Spark for Administrators

Deutschland - Hadoop and Spark for Administrators

Czech Republic - Hadoop and Spark for Administrators

Denmark - Hadoop and Spark for Administrators

Estonia - Hadoop and Spark for Administrators

Finland - Hadoop and Spark for Administrators

Greece - Hadoop and Spark for Administrators

Magyarország - Hadoop and Spark for Administrators

Ireland - Hadoop and Spark for Administrators

Luxembourg - Hadoop and Spark for Administrators

Latvia - Hadoop and Spark for Administrators

España - Hadoop and Spark for Administrators

Italia - Hadoop and Spark for Administrators

Lithuania - Hadoop and Spark for Administrators

Nederland - Hadoop and Spark for Administrators

Norway - Hadoop and Spark for Administrators

Portugal - Hadoop and Spark for Administrators

România - Hadoop and Spark for Administrators

Sverige - Hadoop and Spark for Administrators

Türkiye - Hadoop and Spark for Administrators

Malta - Hadoop and Spark for Administrators

Belgique - Hadoop and Spark for Administrators

France - Hadoop and Spark for Administrators

日本 - Hadoop and Spark for Administrators

Australia - Hadoop and Spark for Administrators

Malaysia - Hadoop and Spark for Administrators

New Zealand - Hadoop and Spark for Administrators

Philippines - Hadoop and Spark for Administrators

Singapore - Hadoop and Spark for Administrators

Thailand - Hadoop and Spark for Administrators

Vietnam - Hadoop and Spark for Administrators

India - Hadoop and Spark for Administrators

Argentina - Hadoop and Spark for Administrators

Chile - Hadoop and Spark for Administrators

Costa Rica - Hadoop and Spark for Administrators

Ecuador - Hadoop and Spark for Administrators

Guatemala - Hadoop and Spark for Administrators

Colombia - Hadoop and Spark for Administrators

México - Hadoop and Spark for Administrators

Panama - Hadoop and Spark for Administrators

Peru - Hadoop and Spark for Administrators

Uruguay - Hadoop and Spark for Administrators

Venezuela - Hadoop and Spark for Administrators

Polska - Hadoop and Spark for Administrators

United Kingdom - Hadoop and Spark for Administrators

South Korea - Hadoop and Spark for Administrators

Pakistan - Hadoop and Spark for Administrators

Sri Lanka - Hadoop and Spark for Administrators

Bulgaria - Hadoop and Spark for Administrators

Bolivia - Hadoop and Spark for Administrators

Indonesia - Hadoop and Spark for Administrators

Kazakhstan - Hadoop and Spark for Administrators

Moldova - Hadoop and Spark for Administrators

Morocco - Hadoop and Spark for Administrators

Tunisia - Hadoop and Spark for Administrators

Kuwait - Hadoop and Spark for Administrators

Oman - Hadoop and Spark for Administrators

Slovakia - Hadoop and Spark for Administrators

Kenya - Hadoop and Spark for Administrators

Nigeria - Hadoop and Spark for Administrators

Botswana - Hadoop and Spark for Administrators

Slovenia - Hadoop and Spark for Administrators

Croatia - Hadoop and Spark for Administrators

Serbia - Hadoop and Spark for Administrators

Bhutan - Hadoop and Spark for Administrators

Nepal - Hadoop and Spark for Administrators

Uzbekistan - Hadoop and Spark for Administrators