Course Code:
bdhat
Duration:
28 hours
Prerequisites:
本课程建议所有有SQL或脚本语言经验的数据分析师、业务分析师、开发人员和管理员参加。在参加本培训之前,不需要具备Apache Hadoop的知识。
Overview:
Big Data 分析师培训是一个实践性课程,推荐给所有未来希望成为数据科学专家的人。该课程专注于现代分析师在Big Data技术中所需的各个方面。在课程中,将展示用于访问、更改、转换和分析存储在Hadoop集群中的复杂数据结构的工具。课程将涵盖Hadoop生态系统(Pig、Hive、Impala、ELK等)中的主题。
- Pig、Hive、Impala、ELK工具的功能,用于数据收集、结果记录和分析。
- Pig、Hive和Impala如何提高典型和日常分析任务的效率。
- 实时执行交互式分析,从海量数据中获取对业务有价值的元素,并如何解释结论。
- 在非常大规模的数据上执行复杂的查询。
Course Outline:
基础 Hadoop。
Pig 简介。
使用 Pig 进行基础数据分析。
使用 Pig 处理复杂数据。
使用 Pig 进行多数据集操作。
Pig 问题解决与优化。
Hive、Impala、ELK 简介。
在 Hive、Impala、ELK 中执行查询。
Hive 中的数据管理。
数据存储与性能。
使用 Hive 和 Impala 工具进行分析。
使用 Impala 和 ELK 工具工作。
文本与复杂数据类型分析。
Hive、Pig、Impala、ELK 的优化。
互操作性与工作流。
问题、任务、认证。
Sites Published: