Course Code: dataprep
Duration: 14 hours
Prerequisites:
  • Podstawowa znajomość pojęć dotyczących danych

Publiczność

  • Analitycy danych
  • Database administratorzy
  • Specjaliści IT
Overview:

DataPrep to inteligentna usługa danych, która ułatwia wizualną eksplorację, czyszczenie i organizację zarówno ustrukturyzowanych, jak i nieustrukturyzowanych danych, przygotowując je do analizy, raportowania i wykorzystania w aplikacjach uczenia maszynowego.

To prowadzone przez instruktora szkolenie na żywo (na miejscu lub zdalnie) jest przeznaczone dla początkujących i średnio zaawansowanych specjalistów IT, którzy chcą zdobyć wiedzę i praktyczne umiejętności wymagane do skutecznego przygotowania danych do analizy, zapewniając dokładność, spójność i niezawodność w różnych zbiorach danych.

Po zakończeniu tego szkolenia uczestnicy będą w stanie

  • Opanować gruntowną wiedzę na temat znaczenia przygotowywania danych w zapewnianiu wysokiej jakości, niezawodnych danych do celów analizy i modelowania.
  • Nabyć praktyczną sprawność w technikach zbierania, czyszczenia, transformacji i integracji danych przy użyciu rzeczywistych zestawów danych.
  • Rozwinąć zdolność do identyfikowania i skutecznego rozwiązywania problemów związanych z danymi, rozbieżnościami i nieścisłościami.

Format kursu

  • Interaktywne wykłady i dyskusje.
  • Dużo ćwiczeń i praktyki.
  • Praktyczne wdrożenie w środowisku live-lab.

Opcje dostosowywania kursu

  • Aby zlecić dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnień.
Course Outline:

Wprowadzenie

  • Zrozumienie znaczenia przygotowania danych w analizie i uczeniu maszynowym
  • Rura przygotowania danych i jej rola w cyklu życia danych
  • Badanie typowych wyzwań związanych z surowymi danymi i ich wpływ na analizę

Zbieranie i pozyskiwanie danych

  • Źródła danych: bazy danych, API, arkusze kalkulacyjne, pliki tekstowe i inne
  • Techniki pozyskiwania danych i zapewniania jakości danych podczas ich zbierania
  • Zbieranie danych z różnych źródeł

Data Cleaning Techniki

  • Wykrywanie i obsługa braków, wartości odchylających i niezgodności
  • Radzenie sobie z duplikatami i błędami w zbiorze danych
  • Czyszczenie rzeczywistych zbiorów danych

Transformacja i standaryzacja danych

  • Techniki normalizacji i standaryzacji danych
  • Obsługa danych kategorycznych: kodowanie, binowanie i inżynieria cech
  • Przekształcanie surowych danych w użyteczne formaty

Data Integration i agregacja

  • Łączenie i kombinowanie zbiorów danych z różnych źródeł
  • Rozwiązywanie konfliktów danych i wyrównywanie typów danych
  • Techniki agregacji i konsolidacji danych

Data Quality Zapewnienie

  • Metody zapewnienia jakości i integralności danych przez cały proces
  • Wdrażanie procedur sprawdzania jakości i walidacji
  • Przykłady i praktyczne zastosowania zapewniania jakości danych

Redukcja wymiarowości i wybór cech

  • Zrozumienie potrzeby redukcji wymiarowości
  • Techniki takie jak PCA, selekcja cech i strategie redukcji
  • Wdrażanie technik redukcji wymiarowości

Podsumowanie i kolejne kroki

Sites Published:

United Arab Emirates - Dataprep Fundamentals

Qatar - Dataprep Fundamentals

Egypt - Dataprep Fundamentals

Saudi Arabia - Dataprep Fundamentals

South Africa - Dataprep Fundamentals

Brasil - Dataprep Fundamentals

Canada - Dataprep Fundamentals

中国 - Dataprep Fundamentals

香港 - Dataprep Fundamentals

澳門 - Dataprep Fundamentals

台灣 - Dataprep Fundamentals

USA - Dataprep Fundamentals

Österreich - Dataprep Fundamentals

Schweiz - Dataprep Fundamentals

Deutschland - Dataprep Fundamentals

Czech Republic - Dataprep Fundamentals

Denmark - Dataprep Fundamentals

Estonia - Dataprep Fundamentals

Finland - Dataprep Fundamentals

Greece - Dataprep Fundamentals

Magyarország - Dataprep Fundamentals

Ireland - Dataprep Fundamentals

Luxembourg - Dataprep Fundamentals

Latvia - Dataprep Fundamentals

España - Dataprep Fundamentals

Italia - Dataprep Fundamentals

Lithuania - Dataprep Fundamentals

Nederland - Dataprep Fundamentals

Norway - Dataprep Fundamentals

Portugal - Dataprep Fundamentals

România - Dataprep Fundamentals

Sverige - Dataprep Fundamentals

Türkiye - Dataprep Fundamentals

Malta - Dataprep Fundamentals

Belgique - Dataprep Fundamentals

France - Dataprep Fundamentals

日本 - Dataprep Fundamentals

Australia - Dataprep Fundamentals

Malaysia - Dataprep Fundamentals

New Zealand - Dataprep Fundamentals

Philippines - Dataprep Fundamentals

Singapore - Dataprep Fundamentals

Thailand - Dataprep Fundamentals

Vietnam - Dataprep Fundamentals

India - Dataprep Fundamentals

Argentina - Dataprep Fundamentals

Chile - Dataprep Fundamentals

Costa Rica - Dataprep Fundamentals

Ecuador - Dataprep Fundamentals

Guatemala - Dataprep Fundamentals

Colombia - Dataprep Fundamentals

México - Dataprep Fundamentals

Panama - Dataprep Fundamentals

Peru - Dataprep Fundamentals

Uruguay - Dataprep Fundamentals

Venezuela - Dataprep Fundamentals

Polska - Dataprep Fundamentals

United Kingdom - Dataprep Fundamentals

South Korea - Dataprep Fundamentals

Pakistan - Dataprep Fundamentals

Sri Lanka - Dataprep Fundamentals

Bulgaria - Dataprep Fundamentals

Bolivia - Dataprep Fundamentals

Indonesia - Dataprep Fundamentals

Kazakhstan - Dataprep Fundamentals

Moldova - Dataprep Fundamentals

Morocco - Dataprep Fundamentals

Tunisia - Dataprep Fundamentals

Kuwait - Dataprep Fundamentals

Oman - Dataprep Fundamentals

Slovakia - Dataprep Fundamentals

Kenya - Dataprep Fundamentals

Nigeria - Dataprep Fundamentals

Botswana - Dataprep Fundamentals

Slovenia - Dataprep Fundamentals

Croatia - Dataprep Fundamentals

Serbia - Dataprep Fundamentals

Bhutan - Dataprep Fundamentals

Nepal - Dataprep Fundamentals

Uzbekistan - Dataprep Fundamentals