Course Code: talend001
Duration: 20 hours
Course Outline:

Wprowadzenie
Teoria: Data Modeling, Data Integration, ETL, ELT
Praca z Talend Open Studio for DI


Import danych z plików tekstowych
Import danych z plików Excel
Wyświetlanie danych i komunikatów w konsoli
Przekształcanie danych: sortowanie, filtrowanie, grupowanie, dzielenie (split), replacement,
modyfikacja przy wykorzystaniu funkcji Talenda i Javy, tworzenie unikatowych ID rekordów
Powielanie strumieni danych (replicate)
Łączenie strumieni danych (unite)
Generowanie testowych danych
Sampling danych


Tworzenie i wykorzystywanie tabel hashowych
Używanie zmiennych kontekstowych
Ładowanie danych kontekstowych z plików (tworzenie plików konfiguracyjnych)

Tworzenie zmiennych globalnych (routines)
Tworzenie własnych funkcji globalnych (routines)


Eksport danych do plików tekstowych (pojedynczych wi dzielonych)
Eksport danych do plików Excel
Import danych z baz danych (MSSQL lub Oracle)
Eksport danych do baz danych
Modyfikacje danych w bazach przy użyciu SQL


Uruchamianie procedur przechowywanych
Pobieranie danych (output) z procedur przechowywanych
Pobieranie wyniku wykonania z procedury przechowywanej (return)
Pobieranie rekordsetu z procedury przechowywanej
Tworzenie child-jobów i uruchamianie ich z poziomu jobu rodzica
Tworzenie joba, który jest odpowiedzialny za rejestrację zdarzeń w pliku log

Praca z folderami, pakowaniem i rozpakowywaniem plików
Import danych (iteracyjnie) z wielu plików
Praca z dyskiem Google (listowanie plików, migracja plików do i z Google drive...)
Obsługa danych odrzuconych (reject)
Obsługa wykonań jednoczesnych (parallel)
Implementacja SCD (slowly changing dimension)


Obsługa błędów w Talendzie
Analiza zgodności danych ze schematem danych
Instalacja i używanie dodatkowych komponentów
Praca z plikami JSON i XML


Używanie Talenda do pobierania danych z WebServices
Uruchamianie zewnętrznych aplikacji (np. skryptów Python)
Budowanie uruchamianego pakietu Talend
Budowanie uruchamianego pakietu Talend z wykorzystaniem parametrów pliku bat


Podsumowanie i wnioski