- Podstawowe zrozumienie analityki danych
- Znajomość Apache Spark
Publiczność
- Inżynierowie danych
- Naukowcy zajmujący się danymi
- Programiści
Azure Databricks to ujednolicona platforma do analizy danych, która umożliwia użytkownikom przechowywanie i wizualizację ogromnych ilości danych z różnych źródeł. Zapewnia środowisko współpracy do łatwego tworzenia, wdrażania i zarządzania obciążeniami związanymi z analizą danych.
Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą konfigurować, wdrażać i zarządzać rozwiązaniami do analizy danych przy użyciu Databricks.
Pod koniec tego szkolenia uczestnicy będą mogli
- Konfigurować i konfigurować Databricks.
- Zrozumieć, w jaki sposób Databricks i Apache Spark współpracują ze sobą.
- Dowiedz się, jak ładować i przekształcać dane w Databricks.
Format kursu
- Interaktywny wykład i dyskusja.
- Wiele ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku laboratoryjnym na żywo.
Opcje dostosowywania kursu
- Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami w celu ustalenia szczegółów.
Wprowadzenie
- Przegląd Databricks i Apache Spark
- Zrozumienie architektury Databricks
Pierwsze kroki
- Konfigurowanie środowiska
- Konfigurowanie i konfigurowanie Databricks
- Poruszanie się po interfejsie użytkownika Databricks
- Tworzenie obszaru roboczego Databricks
Praca z danymi w Databricks
- Łączenie się ze źródłem danych Apache Spark
- Zrozumienie podstawowych kolumn i typów danych
- Zarządzanie systemem plików w Notatnikach
Zarządzanie zadaniami i klastrami
- Tworzenie i konfigurowanie klastrów
- Tworzenie zadań przy użyciu Notebook
- Uruchamianie zadań
- Przeglądanie zadań i ich szczegółów
Korzystanie z Delta Lake w Databricks
- Ładowanie danych do Delta Lake
- Zarządzanie danymi w Delta Lake
Zabezpieczanie Databricks
- Zarządzanie zabezpieczeniami Databricks
- Zarządzanie kopiami zapasowymi i odzyskiwaniem
Rozwiązywanie problemów
Podsumowanie i kolejne kroki