Course Code: bdhat
Duration: 28 hours
Prerequisites:

本课程建议所有有SQL或脚本语言经验的数据分析师、业务分析师、开发人员和管理员参加。在参加本培训之前,不需要具备Apache Hadoop的知识。

Overview:

Big Data 分析师培训是一个实践性课程,推荐给所有未来希望成为数据科学专家的人。该课程专注于现代分析师在Big Data技术中所需的各个方面。在课程中,将展示用于访问、更改、转换和分析存储在Hadoop集群中的复杂数据结构的工具。课程将涵盖Hadoop生态系统(Pig、Hive、Impala、ELK等)中的主题。

  • Pig、Hive、Impala、ELK工具的功能,用于数据收集、结果记录和分析。
  • Pig、Hive和Impala如何提高典型和日常分析任务的效率。
  • 实时执行交互式分析,从海量数据中获取对业务有价值的元素,并如何解释结论。
  • 在非常大规模的数据上执行复杂的查询。
Course Outline:

基础 Hadoop。

Pig 简介。

使用 Pig 进行基础数据分析。

使用 Pig 处理复杂数据。

使用 Pig 进行多数据集操作。

Pig 问题解决与优化。

Hive、Impala、ELK 简介。

在 Hive、Impala、ELK 中执行查询。

Hive 中的数据管理。

数据存储与性能。

使用 Hive 和 Impala 工具进行分析。

使用 Impala 和 ELK 工具工作。

文本与复杂数据类型分析。

Hive、Pig、Impala、ELK 的优化。

互操作性与工作流。

问题、任务、认证。

Sites Published:

Polska - Big Data Hadoop Analyst Training