Course Code: datalakegen2
Duration: 14 hours
Prerequisites:

  • 对云计算基本原理的基本理解
  • 对数据存储解决方案和数据库的基础知识

受众

  • 数据工程师
  • 云专业人员
  • 数据科学家

Overview:

Azure Data Lake Storage Gen2 是 Microsoft Azure 提供的一个全面且高度可扩展的数据存储服务,专为分析工作负载提供平台。

本次由讲师指导的培训(线上或线下)面向中级数据工程师,旨在帮助他们学习如何使用 Azure Data Lake Storage Gen2 实现有效的数据分析解决方案。

培训结束后,参与者将能够:

  • 理解 Azure Data Lake Storage Gen2 的架构和关键特性。
  • 优化数据存储和访问,以实现成本与性能的最佳平衡。
  • 将 Azure Data Lake Storage Gen2 与其他 Azure 服务集成,用于分析和数据处理。
  • 使用 Azure Data Lake Storage Gen2 API 开发解决方案。
  • 解决常见问题并优化存储策略。

课程形式

  • 互动式讲座与讨论。
  • 大量练习与实践。
  • 在实验环境中进行实际操作。

课程定制选项

  • 如需为本课程定制培训,请联系我们安排。

Course Outline:

Azure Data Lake Storage Gen2简介

  • Azure Data Lake Storage Gen2概述
  • 关键特性和优势
  • Azure Data Lake Storage Gen1与Azure Blob Storage的对比

设置Azure Data Lake Storage Gen2

  • 账户创建与配置
  • 理解分层命名空间
  • 数据导入与导出策略

安全与访问控制

  • 实施认证与授权
  • 使用Azure Active Directory (Azure AD)管理访问
  • 数据加密方法与最佳实践

数据管理与成本优化

  • 使用存储层进行数据生命周期管理
  • 性能调优与优化
  • 成本管理与优化策略

与分析服务集成

  • 兼容Azure Data Lake Storage Gen2的分析框架简介
  • 与Azure Databricks、Azure HDInsight和Azure Synapse Analytics的用例
  • 使用Azure Data Factory构建ETL管道

开发者工具与API

  • 可用API与SDK概述
  • 使用Azure Data Lake Storage Gen2 API开发应用
  • 任务的自动化与编排

监控、故障排除与最佳实践

  • 监控存储与访问模式的工具与技术
  • 常见问题故障排除
  • 管理与扩展Azure Data Lake Storage Gen2的最佳实践

总结与下一步