Course Code: pdi3
Duration: 21 hours
Overview:

Pentaho 是一个开源产品,在 Business 智能领域提供全方位的业务解决方案,包括报告、数据分析、仪表板和数据集成。 
借助该平台Pentaho,各个业务部门可以访问各种有价值的信息,从单个客户或产品的销售和盈利能力分析,到人力资源和财务部门的报告,再到为高级管理层提供汇总信息。

本课程面向希望使用 Pentaho Data Integration (PDI) 创建或维护数据提取、转换和加载 (ETL) 流程的开发人员、架构师和应用程序管理员。

培训结束后,参与者将获得与以下相关的技能:

  • 环境的安装和配置 Pentaho,
  • 设计、实施、监控、启动和 调整 ETL 流程,
  • 在 PDI 中使用数据,
    • 不同类型的数据和不同的数据格式
    • 过滤、分组和合并数据
  • 任务调度,
  • 触发变换, 
  • 创造碎屑。

该课程旨在指导参与者从基础到高级。

Course Outline:

第一天

  1. 安装和设置 Pentaho Data Integration
  2. 创建存储库
  3. 了解 Spoon 用户界面
  4. 创建转换
  5. 读取和写入文件
  6. 使用数据库(查询生成器 SQL)
  7. 筛选、分组和合并数据
  8. 使用 XLS

第二天

  1. 创建任务
  2. 定义参数和变量
  3. 数据版本控制(支持有效期)
  4. 转换中的数据库事务性
  5. Java脚本用途
  6. 映射转换
  7. 转换数据类型并对流中的列进行排序
  8. 日志记录处理

第三天

  1. 从命令行运行转换和任务(kitchen.bat、pan.bat)
  2. 任务调度
  3. 并行运行转换
  4. 远程启动 (carte.bat)
  5. 群集和分区
  6. 版本控制和协作工作
Sites Published:

Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)