Course Code:
databricks
Duration:
14 hours
Prerequisites:
- 對數據分析有基本的瞭解
- 知識 Apache Spark
觀眾
- 數據工程師
- 數據科學家
- 開發人員
Overview:
Azure Databricks 是一個統一的數據分析平臺,允許使用者存儲和可視化來自不同來源的大量數據。它提供了一個協作環境,可以輕鬆構建、部署和管理數據分析工作負載。
這種講師指導的現場培訓(在線或現場)面向希望使用 Databricks 設置、部署和管理數據分析解決方案的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 設置和配置 Databricks。
- 瞭解 Databricks 和 Apache Spark 如何協同工作。
- 在 Databricks 中瞭解如何載入和轉換數據。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在即時實驗室環境中動手實施。
課程自定義選項
- 要申請本課程的定製培訓,請聯繫我們進行安排。
Course Outline:
介紹
- Databricks 和 Apache Spark 概述
- 瞭解 Databricks 架構
開始
- 設置環境
- 設定與設定Databricks
- 導航 Databricks 用戶介面
- 創建 Databricks 工作區
在 Databricks 中處理數據
- 連接到 Apache Spark 數據源
- 瞭解基本資訊列和數據類型
- 在 Notebook 中管理文件系統
管理作業和集群
- 創建和配置集群
- 使用 Notebook 建立作業
- 正在運行的作業
- 查看任務和任務詳細資訊
在 Databricks 中使用 Delta Lake
- 將數據載入到 Delta Lake 中
- 在 Delta Lake 中管理數據
固定 Databricks
- 管理 Databricks 安全性
- 管理備份和恢復
故障排除
總結和後續步驟
Sites Published: