- Podstawowa znajomość pojęć dotyczących danych
Publiczność
- Analitycy danych
- Database administratorzy
- Specjaliści IT
DataPrep to inteligentna usługa danych, która ułatwia wizualną eksplorację, czyszczenie i organizację zarówno ustrukturyzowanych, jak i nieustrukturyzowanych danych, przygotowując je do analizy, raportowania i wykorzystania w aplikacjach uczenia maszynowego.
To prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych specjalistów IT, którzy chcą zdobyć wiedzę i praktyczne umiejętności wymagane do skutecznego przygotowania danych do analizy, zapewniając dokładność, spójność i niezawodność w różnych zbiorach danych.
Po zakończeniu tego szkolenia uczestnicy będą w stanie
- Opanować gruntowną wiedzę na temat znaczenia przygotowywania danych w zapewnianiu wysokiej jakości, niezawodnych danych do celów analizy i modelowania.
- Nabyć praktyczną sprawność w technikach zbierania, czyszczenia, transformacji i integracji danych przy użyciu rzeczywistych zestawów danych.
- Rozwinąć zdolność do identyfikowania i skutecznego rozwiązywania problemów związanych z danymi, rozbieżnościami i nieścisłościami.
Format kursu
- Interaktywne wykłady i dyskusje.
- Dużo ćwiczeń i praktyki.
- Praktyczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby zlecić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnień.
Wprowadzenie
- Zrozumienie znaczenia przygotowania danych w analizie i uczeniu maszynowym
- Rura przygotowania danych i jej rola w cyklu życia danych
- Badanie typowych wyzwań związanych z surowymi danymi i ich wpływ na analizę
Zbieranie i pozyskiwanie danych
- Źródła danych: bazy danych, API, arkusze kalkulacyjne, pliki tekstowe i inne
- Techniki pozyskiwania danych i zapewniania jakości danych podczas ich zbierania
- Zbieranie danych z różnych źródeł
Data Cleaning Techniki
- Wykrywanie i obsługa braków, wartości odchylających i niezgodności
- Radzenie sobie z duplikatami i błędami w zbiorze danych
- Czyszczenie rzeczywistych zbiorów danych
Transformacja i standaryzacja danych
- Techniki normalizacji i standaryzacji danych
- Obsługa danych kategorycznych: kodowanie, binowanie i inżynieria cech
- Przekształcanie surowych danych w użyteczne formaty
Data Integration i agregacja
- Łączenie i kombinowanie zbiorów danych z różnych źródeł
- Rozwiązywanie konfliktów danych i wyrównywanie typów danych
- Techniki agregacji i konsolidacji danych
Data Quality Zapewnienie
- Metody zapewnienia jakości i integralności danych przez cały proces
- Wdrażanie procedur sprawdzania jakości i walidacji
- Przykłady i praktyczne zastosowania zapewniania jakości danych
Redukcja wymiarowości i wybór cech
- Zrozumienie potrzeby redukcji wymiarowości
- Techniki takie jak PCA, selekcja cech i strategie redukcji
- Wdrażanie technik redukcji wymiarowości
Podsumowanie i kolejne kroki
United Arab Emirates - Dataprep Fundamentals
Saudi Arabia - Dataprep Fundamentals
South Africa - Dataprep Fundamentals
Brasil - Dataprep Fundamentals
Canada - Dataprep Fundamentals
Österreich - Dataprep Fundamentals
Schweiz - Dataprep Fundamentals
Deutschland - Dataprep Fundamentals
Czech Republic - Dataprep Fundamentals
Denmark - Dataprep Fundamentals
Estonia - Dataprep Fundamentals
Finland - Dataprep Fundamentals
Greece - Dataprep Fundamentals
Magyarország - Dataprep Fundamentals
Ireland - Dataprep Fundamentals
Luxembourg - Dataprep Fundamentals
Latvia - Dataprep Fundamentals
España - Dataprep Fundamentals
Italia - Dataprep Fundamentals
Lithuania - Dataprep Fundamentals
Nederland - Dataprep Fundamentals
Norway - Dataprep Fundamentals
Portugal - Dataprep Fundamentals
România - Dataprep Fundamentals
Sverige - Dataprep Fundamentals
Türkiye - Dataprep Fundamentals
Belgique - Dataprep Fundamentals
France - Dataprep Fundamentals
Australia - Dataprep Fundamentals
Malaysia - Dataprep Fundamentals
New Zealand - Dataprep Fundamentals
Philippines - Dataprep Fundamentals
Singapore - Dataprep Fundamentals
Thailand - Dataprep Fundamentals
Vietnam - Dataprep Fundamentals
Argentina - Dataprep Fundamentals
Costa Rica - Dataprep Fundamentals
Ecuador - Dataprep Fundamentals
Guatemala - Dataprep Fundamentals
Colombia - Dataprep Fundamentals
México - Dataprep Fundamentals
Panama - Dataprep Fundamentals
Uruguay - Dataprep Fundamentals
Venezuela - Dataprep Fundamentals
Polska - Dataprep Fundamentals
United Kingdom - Dataprep Fundamentals
South Korea - Dataprep Fundamentals
Pakistan - Dataprep Fundamentals
Sri Lanka - Dataprep Fundamentals
Bulgaria - Dataprep Fundamentals
Bolivia - Dataprep Fundamentals
Indonesia - Dataprep Fundamentals
Kazakhstan - Dataprep Fundamentals
Moldova - Dataprep Fundamentals
Morocco - Dataprep Fundamentals
Tunisia - Dataprep Fundamentals
Kuwait - Dataprep Fundamentals
Slovakia - Dataprep Fundamentals
Nigeria - Dataprep Fundamentals
Botswana - Dataprep Fundamentals
Slovenia - Dataprep Fundamentals
Croatia - Dataprep Fundamentals
Serbia - Dataprep Fundamentals