Course Code:
pdi3
Duration:
21 hours
Overview:
Pentaho 是一個開源產品,在 Business 智慧領域提供全方位的業務解決方案,包括報告、數據分析、儀錶板和數據集成。
借助該平臺Pentaho,各個營業單位可以訪問各種有價值的資訊,從單個客戶或產品的銷售和盈利能力分析,到人力資源和財務部門的報告,再到為高級管理層提供匯總資訊。
本課程面向希望使用 Pentaho Data Integration (PDI) 建立或維護數據提取、轉換和載入 (ETL) 流程的開發人員、架構師和應用程式管理員。
培訓結束后,參與者將獲得與以下相關的技能:
- 環境的安裝和配置 Pentaho,
- 設計、實施、監控、啟動和 調整 ETL 流程,
- 在 PDI 中使用數據,
- 不同類型的數據和不同的數據格式
- 過濾、分組和合併數據
- 任務調度,
- 觸發變換,
- 創造碎屑。
該課程旨在指導參與者從基礎到高級。
Course Outline:
第一天
- 安裝與設定Pentaho Data Integration
- 創建存儲庫
- 瞭解 Spoon 用戶介面
- 創建轉換
- 讀取和寫入檔
- 使用資料庫(查詢產生器SQL)
- 篩選、分組和合併數據
- 使用 XLS
第二天
- 創建任務
- 定義參數和變數
- 資料版本控制(支援有效期)
- 轉換中的資料庫事務性
- Java腳本用途
- 映射轉換
- 轉換數據類型並對流中的列進行排序
- 日誌記錄處理
第三天
- 從命令列執行轉換和工作(kitchen.bat、pan.bat)
- 任務調度
- 並行運行轉換
- 遠端啟動 (carte.bat)
- 群集和分區
- 版本控制和協作工作
Sites Published:
Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)