Course Code: databricks
Duration: 14 hours
Prerequisites:
  • Podstawowe zrozumienie analityki danych
  • Znajomość Apache Spark

Publiczność

  • Inżynierowie danych
  • Naukowcy zajmujący się danymi
  • Programiści
Overview:

Azure Databricks to ujednolicona platforma do analizy danych, która umożliwia użytkownikom przechowywanie i wizualizację ogromnych ilości danych z różnych źródeł. Zapewnia środowisko współpracy do łatwego tworzenia, wdrażania i zarządzania obciążeniami związanymi z analizą danych.

Szkolenie na żywo prowadzone przez instruktora (na miejscu lub zdalnie) jest przeznaczone dla naukowców zajmujących się danymi i programistów, którzy chcą konfigurować, wdrażać i zarządzać rozwiązaniami do analizy danych przy użyciu Databricks.

Pod koniec tego szkolenia uczestnicy będą mogli

  • Konfigurować i konfigurować Databricks.
  • Zrozumieć, w jaki sposób Databricks i Apache Spark współpracują ze sobą.
  • Dowiedz się, jak ładować i przekształcać dane w Databricks.

Format kursu

  • Interaktywny wykład i dyskusja.
  • Wiele ćwiczeń i praktyki.
  • Praktyczne wdrożenie w środowisku laboratoryjnym na żywo.

Opcje dostosowywania kursu

  • Aby poprosić o spersonalizowane szkolenie dla tego kursu, skontaktuj się z nami w celu ustalenia szczegółów.
Course Outline:

Wprowadzenie

  • Przegląd Databricks i Apache Spark
  • Zrozumienie architektury Databricks

Pierwsze kroki

  • Konfigurowanie środowiska
  • Konfigurowanie i konfigurowanie Databricks
  • Poruszanie się po interfejsie użytkownika Databricks
  • Tworzenie obszaru roboczego Databricks

Praca z danymi w Databricks

  • Łączenie się ze źródłem danych Apache Spark
  • Zrozumienie podstawowych kolumn i typów danych
  • Zarządzanie systemem plików w Notatnikach

Zarządzanie zadaniami i klastrami

  • Tworzenie i konfigurowanie klastrów
  • Tworzenie zadań przy użyciu Notebook
  • Uruchamianie zadań
  • Przeglądanie zadań i ich szczegółów

Korzystanie z Delta Lake w Databricks

  • Ładowanie danych do Delta Lake
  • Zarządzanie danymi w Delta Lake

Zabezpieczanie Databricks

  • Zarządzanie zabezpieczeniami Databricks
  • Zarządzanie kopiami zapasowymi i odzyskiwaniem

Rozwiązywanie problemów

Podsumowanie i kolejne kroki

Sites Published:

United Arab Emirates - Databricks

Qatar - Databricks

Egypt - Databricks

Saudi Arabia - Databricks

South Africa - Databricks

Brasil - Databricks

Canada - Databricks

中国 - Databricks

香港 - Databricks

澳門 - Databricks

台灣 - Databricks

USA - Databricks

Österreich - Databricks

Schweiz - Databricks

Deutschland - Databricks

Czech Republic - Databricks

Denmark - Databricks

Estonia - Databricks

Finland - Databricks

Greece - Databricks

Magyarország - Databricks

Luxembourg - Databricks

Latvia - Databricks

España - Databricks

Italia - Databricks

Lithuania - Databricks

Norway - Databricks

Portugal - Databricks

România - Databricks

Sverige - Databricks

Türkiye - Databricks

Belgique - Databricks

France - Databricks

日本 - Databricks

Australia - Databricks

Malaysia - Databricks

New Zealand - Databricks

Philippines - Databricks

Singapore - Databricks

Thailand - Databricks

Vietnam - Databricks

India - Databricks

Argentina - Databricks

Chile - Databricks

Costa Rica - Databricks

Ecuador - Databricks

Guatemala - Databricks

Colombia - Databricks

México - Databricks

Panama - Databricks

Peru - Databricks

Uruguay - Databricks

Venezuela - Databricks

Polska - Databricks

South Korea - Databricks

Pakistan - Databricks

Sri Lanka - Databricks

Bulgaria - Databricks

Bolivia - Databricks

Indonesia - Databricks

Kazakhstan - Databricks

Moldova - Databricks

Morocco - Databricks

Tunisia - Databricks

Kuwait - Databricks

Oman - Databricks

Slovakia - Databricks

Kenya - Databricks

Nigeria - Databricks

Botswana - Databricks

Slovenia - Databricks

Croatia - Databricks

Serbia - Databricks

Bhutan - Databricks

Nepal - Databricks

Uzbekistan - Databricks