Course Code:
datacleaning
Duration:
7 hours
Prerequisites:
- 了解数据分析概念。
观众
- 数据科学家
- 数据分析师
- Business 分析师
Overview:
Data Cleaning 或数据清理是指在分析数据集之前检测和修复数据集中问题的过程。
这种由讲师指导的实时培训(在线或现场)面向希望有效清理和处理数据的数据科学家、数据分析师和业务分析师。
在本次培训结束时,参与者将能够:
- 制定有效的数据清理策略。
- 实施有用的数据清理工具。
- 更高效地获得结果。
- 了解并应用数据清理最佳实践。
课程形式
- 互动讲座和讨论。
- 大量的练习和练习。
- 在即时实验室环境中动手实施。
课程自定义选项
- 要申请本课程的定制培训,请联系我们进行安排。
Course Outline:
介绍
概述 Data Cleaning
- 为什么 Data Cleaning 很重要?
案例研究:当 Big Data 脏 时
制定全面的 Data Cleaning 策略
常用 Data Cleaning 工具
- 雄鸭
- OpenRefine 公司
- Pandas(用于 Python)
- Dplyr(用于 R)
实现高数据完整性
- 完成
- 正确
- 准确
- 相关
- 一致
自动化 Data Cleaning 流程
监控 Data Cleaning 系统
总结和结论
Sites Published:
United Arab Emirates - Data Cleaning
Czech Republic - Data Cleaning