Course Code: datalakegen2
Duration: 14 hours
Prerequisites:
- 对云计算基本原理的基本理解
- 对数据存储解决方案和数据库的基础知识
受众
- 数据工程师
- 云专业人员
- 数据科学家
Overview:
Azure Data Lake Storage Gen2 是 Microsoft Azure 提供的一个全面且高度可扩展的数据存储服务,专为分析工作负载提供平台。
本次由讲师指导的培训(线上或线下)面向中级数据工程师,旨在帮助他们学习如何使用 Azure Data Lake Storage Gen2 实现有效的数据分析解决方案。
培训结束后,参与者将能够:
- 理解 Azure Data Lake Storage Gen2 的架构和关键特性。
- 优化数据存储和访问,以实现成本与性能的最佳平衡。
- 将 Azure Data Lake Storage Gen2 与其他 Azure 服务集成,用于分析和数据处理。
- 使用 Azure Data Lake Storage Gen2 API 开发解决方案。
- 解决常见问题并优化存储策略。
课程形式
- 互动式讲座与讨论。
- 大量练习与实践。
- 在实验环境中进行实际操作。
课程定制选项
- 如需为本课程定制培训,请联系我们安排。
Course Outline:
Azure Data Lake Storage Gen2简介
- Azure Data Lake Storage Gen2概述
- 关键特性和优势
- Azure Data Lake Storage Gen1与Azure Blob Storage的对比
设置Azure Data Lake Storage Gen2
- 账户创建与配置
- 理解分层命名空间
- 数据导入与导出策略
安全与访问控制
- 实施认证与授权
- 使用Azure Active Directory (Azure AD)管理访问
- 数据加密方法与最佳实践
数据管理与成本优化
- 使用存储层进行数据生命周期管理
- 性能调优与优化
- 成本管理与优化策略
与分析服务集成
- 兼容Azure Data Lake Storage Gen2的分析框架简介
- 与Azure Databricks、Azure HDInsight和Azure Synapse Analytics的用例
- 使用Azure Data Factory构建ETL管道
开发者工具与API
- 可用API与SDK概述
- 使用Azure Data Lake Storage Gen2 API开发应用
- 任务的自动化与编排
监控、故障排除与最佳实践
- 监控存储与访问模式的工具与技术
- 常见问题故障排除
- 管理与扩展Azure Data Lake Storage Gen2的最佳实践
总结与下一步