Pentaho jest produktem dystrybuowanym na zasadzie licencji Open Source, który dostarcza pełnej gamy rozwiązań dla biznesu w obszarze Business Intelligence, włączając w to raportowanie, analizy danych, kokpity managerskie i integrację danych.
Dzięki platformie Pentaho poszczególne komórki biznesu uzyskują dostęp do szerokiego wachlarza cennych informacji, począwszy od analiz sprzedaży i opłacalności poszczególnych klientów czy produktów, poprzez raportowanie na potrzeby HR i działów finansowych, aż do dostarczania informacji zbiorczych na potrzeby kierownictwa wyższego szczebla.
Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy ekstrakcji, transformacji i ładowania danych (ETL) z wykorzystaniem Pentaho Data Integration (PDI).
Po szkoleniu uczestnik nabędzie umiejętności związane z:
- instalacją i konfiguracją środowiska Pentaho,
- projektowaniem, implementowaniem, monitorowaniem, uruchamianiem i strojeniem procesów ETL,
- pracy z danymi w PDI,
- wprowadzaniem różnych typów danych oraz różnych formatów danych
- filtrowaniem, grupowaniem oraz łączeniem danych
- harmonogramowaniem zadań,
- uruchamianiem transformacji,
- tworzeniu klastów.
Kurs ma zadanie przeprowadzić uczestnika od poziomu podstawowego do zaawansowanego.
Dzień pierwszy
- Instalacja i konfiguracja Pentaho Data Integration
- Utworzenie repozytorium
- Zapoznanie się z interfejsem użytkownika Spoon
- Tworzenie transformacji
- Odczyt i zapis do pliku
- Praca z bazami danych (generator zapytań SQL)
- Filtrowanie, grupowanie oraz łączenie danych
- Praca z XLS
Dzień drugi
- Tworzenie zadań
- Definiowanie parametrów i zmiennych
- Wersjonowanie danych (obsługa okresów obowiązywania)
- Transakcyjność bazodanowa w transformacjach
- Wykorzystanie JavaScript
- Transformacje mapujące
- Konwersja typów danych oraz kolejność kolumn w strumieniu
- Logowanie przetwarzanie
Dzień trzeci
- Uruchamianie transformacji i zadań z linii poleceń (kitchen.bat, pan.bat)
- Harmonogramowanie zadań
- Uruchamianie transformacji równolegle
- Uruchamianie zdalne (carte.bat)
- Tworzenie klastrów oraz partycjonowanie
- Wersjonowanie i praca grupowa
Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)