Course Code:
sparksql
Duration:
7 hours
Prerequisites:
- 具有 SQL 查詢的經驗
- 任何語言的程式設計經驗
觀眾
- 數據分析師
- 數據科學家
- 數據工程師
Overview:
Spark SQL是Apache Spark用於處理結構化和非結構化數據的模塊。 Spark SQL提供有關數據結構以及正在執行的計算的信息。此信息可用於執行優化。 Spark SQL兩個常見用途是:
- 執行SQL查詢。
- 從現有Hive安裝中讀取數據。
在這個由講師指導的實時培訓(現場或遠程)中,參與者將學習如何使用Spark SQL分析各種類型的數據集。
在培訓結束時,參與者將能夠:
- 安裝和配置Spark SQL 。
- 使用Spark SQL執行數據分析。
- 以不同格式查詢數據集。
- 可視化數據和查詢結果。
課程格式
- 互動講座和討論。
- 大量的練習和練習。
- 在實時實驗室環境中親自實施。
課程自定義選項
- 要申請本課程的定制培訓,請聯繫我們安排。
Course Outline:
介紹
資料存取方法概述(Hive、資料庫等)
Spark 功能和體系結構概述
安裝和配置 Spark
瞭解 Spark 中的數據幀
定義表和導入數據集
使用 SQL 查詢數據框
執行聚合、JOIN 和嵌套查詢
上傳和 Accessing 數據
查詢不同類型的數據
- JSON、Parquet 等
使用 SQL 查詢數據湖
故障排除
總結和結論
Sites Published:
United Arab Emirates - Apache Spark SQL
Saudi Arabia - Apache Spark SQL
South Africa - Apache Spark SQL
Deutschland - Apache Spark SQL
Czech Republic - Apache Spark SQL
Magyarország - Apache Spark SQL
New Zealand - Apache Spark SQL
Philippines - Apache Spark SQL
United Kingdom - Apache Spark SQL