Course Code:
datacleaning
Duration:
7 hours
Prerequisites:
- 了解數據分析概念。
觀眾
- 數據科學家
- 數據分析師
- Business 分析師
Overview:
Data Cleaning 或數據清理是指在分析數據集之前檢測和修復數據集中問題的過程。
這種由講師指導的實時培訓(在線或現場)面向希望有效清理和處理數據的數據科學家、數據分析師和業務分析師。
在本次培訓結束時,參與者將能夠:
- 制定有效的數據清理策略。
- 實施有用的數據清理工具。
- 更高效地獲得結果。
- 瞭解並應用數據清理最佳實踐。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在即時實驗室環境中動手實施。
課程自定義選項
- 要申請本課程的定製培訓,請聯繫我們進行安排。
Course Outline:
介紹
概述 Data Cleaning
- 為什麼 Data Cleaning 很重要?
案例研究:當 Big Data 臟 時
制定全面的 Data Cleaning 策略
常用 Data Cleaning 工具
- 雄鴨
- OpenRefine 公司
- Pandas(用於 Python)
- Dplyr(用於 R)
實現高數據完整性
- 完成
- 正確
- 準確
- 相關
- 一致
自動化 Data Cleaning 流程
監控 Data Cleaning 系統
總結和結論
Sites Published:
United Arab Emirates - Data Cleaning
Czech Republic - Data Cleaning