Course Code: sparkpythonhadoop
Duration: 21 hours
Prerequisites:
  • Doświadczenie ze Sparkiem i Hadoop
  • Python doświadczenie w programowaniu

Publiczność

  • Naukowcy zajmujący się danymi
  • Programiści
Overview:

Python to skalowalny, elastyczny i szeroko stosowany język programowania do nauki o danych i uczenia maszynowego. Spark to silnik przetwarzania danych wykorzystywany do wyszukiwania, analizowania i przekształcania dużych zbiorów danych, podczas gdy Hadoop to biblioteka oprogramowania do przechowywania i przetwarzania danych na dużą skalę.

Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą używać i integrować Spark, Hadoop i Python do przetwarzania, analizowania i przekształcania dużych i złożonych zestawów danych.

Pod koniec tego szkolenia uczestnicy będą mogli

  • Skonfigurować środowisko niezbędne do rozpoczęcia przetwarzania dużych zbiorów danych za pomocą Spark, Hadoop i Python.
  • Zrozumieć funkcje, podstawowe komponenty i architekturę Spark i Hadoop.
  • Dowiedz się, jak zintegrować Spark, Hadoop i Python w celu przetwarzania dużych zbiorów danych.
  • Poznanie narzędzi w ekosystemie Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka i Flume).
  • Tworzenie systemów rekomendacji opartych na filtrowaniu kolaboracyjnym podobnych do Netflix, YouTube, Amazon, Spotify i Google.
  • Użyj Apache Mahout do skalowania algorytmów uczenia maszynowego.

Format kursu

  • Interaktywny wykład i dyskusja.
  • Wiele ćwiczeń i praktyki.
  • Praktyczne wdrożenie w środowisku laboratorium na żywo.

Opcje dostosowywania kursu

  • Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami w celu ustalenia szczegółów.
Course Outline:

Wprowadzenie

  • Przegląd funkcji i architektury Spark i Hadoop
  • Zrozumienie dużych zbiorów danych
  • Podstawy programowania Python

Pierwsze kroki

  • Konfiguracja Python, Spark i Hadoop
  • Zrozumienie struktur danych w Python
  • Zrozumienie interfejsu API PySpark
  • Zrozumienie HDFS i MapReduce

Integracja Sparka i Hadoop z Python

  • Wdrażanie Spark RDD w Python
  • Przetwarzanie danych przy użyciu MapReduce
  • Tworzenie rozproszonych zbiorów danych w HDFS

Przetwarzanie Machine Learning za pomocą Spark MLlib

Przetwarzanie Big Data z Spark Streaming

Praca z systemami rekomendacji

Praca z Kafką, Sqoop, Kafką i Flume

Apache Mahout ze Spark i Hadoop

Rozwiązywanie problemów

Podsumowanie i kolejne kroki

Sites Published:

United Arab Emirates - Python, Spark, and Hadoop for Big Data

Qatar - Python, Spark, and Hadoop for Big Data

Egypt - Python, Spark, and Hadoop for Big Data

Saudi Arabia - Python, Spark, and Hadoop for Big Data

South Africa - Python, Spark, and Hadoop for Big Data

Brasil - Python, Spark, and Hadoop for Big Data

Canada - Python, Spark, and Hadoop for Big Data

中国 - Python, Spark, and Hadoop for Big Data

香港 - Python, Spark, and Hadoop for Big Data

澳門 - Python, Spark, and Hadoop for Big Data

台灣 - Python, Spark, and Hadoop for Big Data

USA - Python, Spark, and Hadoop for Big Data

Österreich - Python, Spark, and Hadoop for Big Data

Schweiz - Python, Spark, and Hadoop for Big Data

Deutschland - Python, Spark, and Hadoop for Big Data

Czech Republic - Python, Spark, and Hadoop for Big Data

Denmark - Python, Spark, and Hadoop for Big Data

Estonia - Python, Spark, and Hadoop for Big Data

Finland - Python, Spark, and Hadoop for Big Data

Greece - Python, Spark, and Hadoop for Big Data

Magyarország - Python, Spark, and Hadoop for Big Data

Ireland - Python, Spark, and Hadoop for Big Data

Luxembourg - Python, Spark, and Hadoop for Big Data

Latvia - Python, Spark, and Hadoop for Big Data

España - Python, Spark, and Hadoop for Big Data

Italia - Python, Spark, and Hadoop for Big Data

Lithuania - Python, Spark, and Hadoop for Big Data

Nederland - Python, Spark, and Hadoop for Big Data

Norway - Python, Spark, and Hadoop for Big Data

Portugal - Python, Spark, and Hadoop for Big Data

România - Python, Spark, and Hadoop for Big Data

Sverige - Python, Spark, and Hadoop for Big Data

Türkiye - Python, Spark, and Hadoop for Big Data

Malta - Python, Spark, and Hadoop for Big Data

Belgique - Python, Spark, and Hadoop for Big Data

France - Python, Spark, and Hadoop for Big Data

日本 - Python, Spark, and Hadoop for Big Data

Australia - Python, Spark, and Hadoop for Big Data

Malaysia - Python, Spark, and Hadoop for Big Data

New Zealand - Python, Spark, and Hadoop for Big Data

Philippines - Python, Spark, and Hadoop for Big Data

Singapore - Python, Spark, and Hadoop for Big Data

Thailand - Python, Spark, and Hadoop for Big Data

Vietnam - Python, Spark, and Hadoop for Big Data

India - Python, Spark, and Hadoop for Big Data

Argentina - Python, Spark, and Hadoop for Big Data

Chile - Python, Spark, and Hadoop for Big Data

Costa Rica - Python, Spark, and Hadoop for Big Data

Ecuador - Python, Spark, and Hadoop for Big Data

Guatemala - Python, Spark, and Hadoop for Big Data

Colombia - Python, Spark, and Hadoop for Big Data

México - Python, Spark, and Hadoop for Big Data

Panama - Python, Spark, and Hadoop for Big Data

Peru - Python, Spark, and Hadoop for Big Data

Uruguay - Python, Spark, and Hadoop for Big Data

Venezuela - Python, Spark, and Hadoop for Big Data

Polska - Python, Spark, and Hadoop for Big Data

United Kingdom - Python, Spark, and Hadoop for Big Data

South Korea - Python, Spark, and Hadoop for Big Data

Pakistan - Python, Spark, and Hadoop for Big Data

Sri Lanka - Python, Spark, and Hadoop for Big Data

Bulgaria - Python, Spark, and Hadoop for Big Data

Bolivia - Python, Spark, and Hadoop for Big Data

Indonesia - Python, Spark, and Hadoop for Big Data

Kazakhstan - Python, Spark, and Hadoop for Big Data

Moldova - Python, Spark, and Hadoop for Big Data

Morocco - Python, Spark, and Hadoop for Big Data

Tunisia - Python, Spark, and Hadoop for Big Data

Kuwait - Python, Spark, and Hadoop for Big Data

Oman - Python, Spark, and Hadoop for Big Data

Slovakia - Python, Spark, and Hadoop for Big Data

Kenya - Python, Spark, and Hadoop for Big Data

Nigeria - Python, Spark, and Hadoop for Big Data

Botswana - Python, Spark, and Hadoop for Big Data

Slovenia - Python, Spark, and Hadoop for Big Data

Croatia - Python, Spark, and Hadoop for Big Data

Serbia - Python, Spark, and Hadoop for Big Data

Bhutan - Python, Spark, and Hadoop for Big Data

Nepal - Python, Spark, and Hadoop for Big Data

Uzbekistan - Python, Spark, and Hadoop for Big Data