- Doświadczenie ze Sparkiem i Hadoop
- Python doświadczenie w programowaniu
Publiczność
- Naukowcy zajmujący się danymi
- Programiści
Python to skalowalny, elastyczny i szeroko stosowany język programowania do nauki o danych i uczenia maszynowego. Spark to silnik przetwarzania danych wykorzystywany do wyszukiwania, analizowania i przekształcania dużych zbiorów danych, podczas gdy Hadoop to biblioteka oprogramowania do przechowywania i przetwarzania danych na dużą skalę.
Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla programistów, którzy chcą używać i integrować Spark, Hadoop i Python do przetwarzania, analizowania i przekształcania dużych i złożonych zestawów danych.
Pod koniec tego szkolenia uczestnicy będą mogli
- Skonfigurować środowisko niezbędne do rozpoczęcia przetwarzania dużych zbiorów danych za pomocą Spark, Hadoop i Python.
- Zrozumieć funkcje, podstawowe komponenty i architekturę Spark i Hadoop.
- Dowiedz się, jak zintegrować Spark, Hadoop i Python w celu przetwarzania dużych zbiorów danych.
- Poznanie narzędzi w ekosystemie Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka i Flume).
- Tworzenie systemów rekomendacji opartych na filtrowaniu kolaboracyjnym podobnych do Netflix, YouTube, Amazon, Spotify i Google.
- Użyj Apache Mahout do skalowania algorytmów uczenia maszynowego.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku laboratorium na żywo.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami w celu ustalenia szczegółów.
Wprowadzenie
- Przegląd funkcji i architektury Spark i Hadoop
- Zrozumienie dużych zbiorów danych
- Podstawy programowania Python
Pierwsze kroki
- Konfiguracja Python, Spark i Hadoop
- Zrozumienie struktur danych w Python
- Zrozumienie interfejsu API PySpark
- Zrozumienie HDFS i MapReduce
Integracja Sparka i Hadoop z Python
- Wdrażanie Spark RDD w Python
- Przetwarzanie danych przy użyciu MapReduce
- Tworzenie rozproszonych zbiorów danych w HDFS
Przetwarzanie Machine Learning za pomocą Spark MLlib
Przetwarzanie Big Data z Spark Streaming
Praca z systemami rekomendacji
Praca z Kafką, Sqoop, Kafką i Flume
Apache Mahout ze Spark i Hadoop
Rozwiązywanie problemów
Podsumowanie i kolejne kroki
United Arab Emirates - Python, Spark, and Hadoop for Big Data
Qatar - Python, Spark, and Hadoop for Big Data
Egypt - Python, Spark, and Hadoop for Big Data
Saudi Arabia - Python, Spark, and Hadoop for Big Data
South Africa - Python, Spark, and Hadoop for Big Data
Brasil - Python, Spark, and Hadoop for Big Data
Canada - Python, Spark, and Hadoop for Big Data
中国 - Python, Spark, and Hadoop for Big Data
香港 - Python, Spark, and Hadoop for Big Data
澳門 - Python, Spark, and Hadoop for Big Data
台灣 - Python, Spark, and Hadoop for Big Data
USA - Python, Spark, and Hadoop for Big Data
Österreich - Python, Spark, and Hadoop for Big Data
Schweiz - Python, Spark, and Hadoop for Big Data
Deutschland - Python, Spark, and Hadoop for Big Data
Czech Republic - Python, Spark, and Hadoop for Big Data
Denmark - Python, Spark, and Hadoop for Big Data
Estonia - Python, Spark, and Hadoop for Big Data
Finland - Python, Spark, and Hadoop for Big Data
Greece - Python, Spark, and Hadoop for Big Data
Magyarország - Python, Spark, and Hadoop for Big Data
Ireland - Python, Spark, and Hadoop for Big Data
Luxembourg - Python, Spark, and Hadoop for Big Data
Latvia - Python, Spark, and Hadoop for Big Data
España - Python, Spark, and Hadoop for Big Data
Italia - Python, Spark, and Hadoop for Big Data
Lithuania - Python, Spark, and Hadoop for Big Data
Nederland - Python, Spark, and Hadoop for Big Data
Norway - Python, Spark, and Hadoop for Big Data
Portugal - Python, Spark, and Hadoop for Big Data
România - Python, Spark, and Hadoop for Big Data
Sverige - Python, Spark, and Hadoop for Big Data
Türkiye - Python, Spark, and Hadoop for Big Data
Malta - Python, Spark, and Hadoop for Big Data
Belgique - Python, Spark, and Hadoop for Big Data
France - Python, Spark, and Hadoop for Big Data
日本 - Python, Spark, and Hadoop for Big Data
Australia - Python, Spark, and Hadoop for Big Data
Malaysia - Python, Spark, and Hadoop for Big Data
New Zealand - Python, Spark, and Hadoop for Big Data
Philippines - Python, Spark, and Hadoop for Big Data
Singapore - Python, Spark, and Hadoop for Big Data
Thailand - Python, Spark, and Hadoop for Big Data
Vietnam - Python, Spark, and Hadoop for Big Data
India - Python, Spark, and Hadoop for Big Data
Argentina - Python, Spark, and Hadoop for Big Data
Chile - Python, Spark, and Hadoop for Big Data
Costa Rica - Python, Spark, and Hadoop for Big Data
Ecuador - Python, Spark, and Hadoop for Big Data
Guatemala - Python, Spark, and Hadoop for Big Data
Colombia - Python, Spark, and Hadoop for Big Data
México - Python, Spark, and Hadoop for Big Data
Panama - Python, Spark, and Hadoop for Big Data
Peru - Python, Spark, and Hadoop for Big Data
Uruguay - Python, Spark, and Hadoop for Big Data
Venezuela - Python, Spark, and Hadoop for Big Data
Polska - Python, Spark, and Hadoop for Big Data
United Kingdom - Python, Spark, and Hadoop for Big Data
South Korea - Python, Spark, and Hadoop for Big Data
Pakistan - Python, Spark, and Hadoop for Big Data
Sri Lanka - Python, Spark, and Hadoop for Big Data
Bulgaria - Python, Spark, and Hadoop for Big Data
Bolivia - Python, Spark, and Hadoop for Big Data
Indonesia - Python, Spark, and Hadoop for Big Data
Kazakhstan - Python, Spark, and Hadoop for Big Data
Moldova - Python, Spark, and Hadoop for Big Data
Morocco - Python, Spark, and Hadoop for Big Data
Tunisia - Python, Spark, and Hadoop for Big Data
Kuwait - Python, Spark, and Hadoop for Big Data
Oman - Python, Spark, and Hadoop for Big Data
Slovakia - Python, Spark, and Hadoop for Big Data
Kenya - Python, Spark, and Hadoop for Big Data
Nigeria - Python, Spark, and Hadoop for Big Data
Botswana - Python, Spark, and Hadoop for Big Data
Slovenia - Python, Spark, and Hadoop for Big Data
Croatia - Python, Spark, and Hadoop for Big Data
Serbia - Python, Spark, and Hadoop for Big Data
Bhutan - Python, Spark, and Hadoop for Big Data