Course Code:
pdi3
Duration:
21 hours
Overview:
Pentaho 是一个开源产品,在 Business 智能领域提供全方位的业务解决方案,包括报告、数据分析、仪表板和数据集成。
借助该平台Pentaho,各个业务部门可以访问各种有价值的信息,从单个客户或产品的销售和盈利能力分析,到人力资源和财务部门的报告,再到为高级管理层提供汇总信息。
本课程面向希望使用 Pentaho Data Integration (PDI) 创建或维护数据提取、转换和加载 (ETL) 流程的开发人员、架构师和应用程序管理员。
培训结束后,参与者将获得与以下相关的技能:
- 环境的安装和配置 Pentaho,
- 设计、实施、监控、启动和 调整 ETL 流程,
- 在 PDI 中使用数据,
- 不同类型的数据和不同的数据格式
- 过滤、分组和合并数据
- 任务调度,
- 触发变换,
- 创造碎屑。
该课程旨在指导参与者从基础到高级。
Course Outline:
第一天
- 安装和设置 Pentaho Data Integration
- 创建存储库
- 了解 Spoon 用户界面
- 创建转换
- 读取和写入文件
- 使用数据库(查询生成器 SQL)
- 筛选、分组和合并数据
- 使用 XLS
第二天
- 创建任务
- 定义参数和变量
- 数据版本控制(支持有效期)
- 转换中的数据库事务性
- Java脚本用途
- 映射转换
- 转换数据类型并对流中的列进行排序
- 日志记录处理
第三天
- 从命令行运行转换和任务(kitchen.bat、pan.bat)
- 任务调度
- 并行运行转换
- 远程启动 (carte.bat)
- 群集和分区
- 版本控制和协作工作
Sites Published:
Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)