Course Code:
databricks
Duration:
14 hours
Prerequisites:
- 对数据分析有基本的了解
- 知识 Apache Spark
观众
- 数据工程师
- 数据科学家
- 开发人员
Overview:
Azure Databricks 是一个统一的数据分析平台,允许使用者存储和可视化来自不同来源的大量数据。它提供了一个协作环境,可以轻松构建、部署和管理数据分析工作负载。
这种讲师指导的现场培训(在线或现场)面向希望使用 Databricks 设置、部署和管理数据分析解决方案的数据科学家和开发人员。
在本次培训结束时,参与者将能够:
- 设置和配置 Databricks。
- 了解 Databricks 和 Apache Spark 如何协同工作。
- 在 Databricks 中了解如何载入和转换数据。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在即时实验室环境中动手实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们进行安排。
Course Outline:
介绍
- Databricks 和 Apache Spark 概述
- 了解 Databricks 架构
开始
- 设置环境
- 设定与设定Databricks
- 导航 Databricks 用户介面
- 创建 Databricks 工作区
在 Databricks 中处理数据
- 连接到 Apache Spark 数据源
- 了解基本资讯列和数据类型
- 在 Notebook 中管理文件系统
管理作业和集群
- 创建和配置集群
- 使用 Notebook 建立作业
- 正在运行的作业
- 查看任务和任务详细资讯
在 Databricks 中使用 Delta Lake
- 将数据载入到 Delta Lake 中
- 在 Delta Lake 中管理数据
固定 Databricks
- 管理 Databricks 安全性
- 管理备份和恢复
故障排除
总结和后续步骤
Sites Published: