Course Code: pdi3
Duration: 21 hours
Overview:

Pentaho jest produktem dystrybuowanym na zasadzie licencji Open Source, który dostarcza pełnej gamy rozwiązań dla biznesu w obszarze Business Intelligence, włączając w to raportowanie, analizy danych, kokpity managerskie i integrację danych. 
Dzięki platformie Pentaho poszczególne komórki biznesu uzyskują dostęp do szerokiego wachlarza cennych informacji, począwszy od analiz sprzedaży i opłacalności poszczególnych klientów czy produktów, poprzez raportowanie na potrzeby HR i działów finansowych, aż do dostarczania informacji zbiorczych na potrzeby kierownictwa wyższego szczebla.

Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy ekstrakcji, transformacji i ładowania danych (ETL) z wykorzystaniem Pentaho Data Integration (PDI).

Po szkoleniu uczestnik nabędzie umiejętności związane z:

  • instalacją i konfiguracją środowiska Pentaho,
  • projektowaniem, implementowaniem, monitorowaniem, uruchamianiem i strojeniem procesów ETL,
  • pracy z danymi w PDI,
    • wprowadzaniem różnych typów danych oraz różnych formatów danych
    • filtrowaniem, grupowaniem oraz łączeniem danych
  • harmonogramowaniem zadań,
  • uruchamianiem transformacji, 
  • tworzeniu klastów.

Kurs ma zadanie przeprowadzić uczestnika od poziomu podstawowego do zaawansowanego.

Course Outline:

Dzień pierwszy

  1. Instalacja i konfiguracja Pentaho Data Integration
  2. Utworzenie repozytorium
  3. Zapoznanie się z interfejsem użytkownika Spoon
  4. Tworzenie transformacji
  5. Odczyt i zapis do pliku
  6. Praca z bazami danych (generator zapytań SQL)
  7. Filtrowanie, grupowanie oraz łączenie danych
  8. Praca z XLS

Dzień drugi

  1. Tworzenie zadań
  2. Definiowanie parametrów i zmiennych
  3. Wersjonowanie danych (obsługa okresów obowiązywania)
  4. Transakcyjność bazodanowa w transformacjach
  5. Wykorzystanie JavaScript
  6. Transformacje mapujące
  7. Konwersja typów danych oraz kolejność kolumn w strumieniu
  8. Logowanie przetwarzanie

Dzień trzeci

  1. Uruchamianie transformacji i zadań z linii poleceń (kitchen.bat, pan.bat)
  2. Harmonogramowanie zadań
  3. Uruchamianie transformacji równolegle
  4. Uruchamianie zdalne (carte.bat)
  5. Tworzenie klastrów oraz partycjonowanie
  6. Wersjonowanie i praca grupowa
Sites Published:

Polska - Pentaho Data Integration (PDI) - moduł do przetwarzania danych ETL (poziom zaawansowany)