Course Code:
sparksql
Duration:
7 hours
Prerequisites:
- 具有 SQL 查询的经验
- 任何语言的编程经验
观众
- 数据分析师
- 数据科学家
- 数据工程师
Overview:
Spark SQL是Apache Spark用于处理结构化和非结构化数据的模块。 Spark SQL提供有关数据结构以及正在执行的计算的信息。此信息可用于执行优化。 Spark SQL两个常见用途是:
- 执行SQL查询。
- 从现有Hive安装中读取数据。
在这个由讲师指导的实时培训(现场或远程)中,参与者将学习如何使用Spark SQL分析各种类型的数据集。
在培训结束时,参与者将能够:
- 安装和配置Spark SQL 。
- 使用Spark SQL执行数据分析。
- 以不同格式查询数据集。
- 可视化数据和查询结果。
课程格式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在实时实验室环境中亲自实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们安排。
Course Outline:
介绍
数据访问方法概述(Hive、数据库等)
Spark 功能和体系结构概述
安装和配置 Spark
了解 Spark 中的数据帧
定义表和导入数据集
使用 SQL 查询数据框
执行聚合、JOIN 和嵌套查询
上传和 Accessing 数据
查询不同类型的数据
- JSON、Parquet 等
使用 SQL 查询数据湖
故障 排除
总结和结论
Sites Published:
United Arab Emirates - Apache Spark SQL
Saudi Arabia - Apache Spark SQL
South Africa - Apache Spark SQL
Deutschland - Apache Spark SQL
Czech Republic - Apache Spark SQL
Magyarország - Apache Spark SQL
New Zealand - Apache Spark SQL
Philippines - Apache Spark SQL
United Kingdom - Apache Spark SQL