Course Code: pdi3
Duration: 21 hours
Overview:

Pentaho 是一個開源產品,在 Business 智慧領域提供全方位的業務解決方案,包括報告、數據分析、儀錶板和數據集成。 
借助該平臺Pentaho,各個營業單位可以訪問各種有價值的資訊,從單個客戶或產品的銷售和盈利能力分析,到人力資源和財務部門的報告,再到為高級管理層提供匯總資訊。

本課程面向希望使用 Pentaho Data Integration (PDI) 建立或維護數據提取、轉換和載入 (ETL) 流程的開發人員、架構師和應用程式管理員。

培訓結束后,參與者將獲得與以下相關的技能:

  • 環境的安裝和配置 Pentaho,
  • 設計、實施、監控、啟動和 調整 ETL 流程,
  • 在 PDI 中使用數據,
    • 不同類型的數據和不同的數據格式
    • 過濾、分組和合併數據
  • 任務調度,
  • 觸發變換, 
  • 創造碎屑。

該課程旨在指導參與者從基礎到高級。

Course Outline:

第一天

  1. 安裝與設定Pentaho Data Integration
  2. 創建存儲庫
  3. 瞭解 Spoon 用戶介面
  4. 創建轉換
  5. 讀取和寫入檔
  6. 使用資料庫(查詢產生器SQL)
  7. 篩選、分組和合併數據
  8. 使用 XLS

第二天

  1. 創建任務
  2. 定義參數和變數
  3. 資料版本控制(支援有效期)
  4. 轉換中的資料庫事務性
  5. Java腳本用途
  6. 映射轉換
  7. 轉換數據類型並對流中的列進行排序
  8. 日誌記錄處理

第三天

  1. 從命令列執行轉換和工作(kitchen.bat、pan.bat)
  2. 任務調度
  3. 並行運行轉換
  4. 遠端啟動 (carte.bat)
  5. 群集和分區
  6. 版本控制和協作工作
Sites Published:

Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)