Course Code: datascib
Duration: 35 hours
Prerequisites:

商业 培训 Data Science 是针对几组人的。首先,它是针对企业本身的人的。那些将与统计学家和数据分析师(数据科学家,或有时在波兰被称为“数据大师”)合作的人。很多时候,这些人会管理专注于业务数据分析的项目,或者会投资数据科学企业。除了这个小组之外,该培训还面向那些将实施专注于数据分析的解决方案的人。对于这些人来说,这是关于提供一个与企业相互理解的平台,而企业对实施本身的细节不是很感兴趣。当然,第三组不应该被遗忘。关于那些渴望成为数据大师的人。

训练不是算法训练。它也不是在特定的大数据系统中进行培训。单独的培训课程专门针对这些主题,但如果没有某些基本概念和原则性原则的知识,数据科学 项目 就注定要提前失败。由于技术的发展非常快,它往往模糊了应该构建解决方案的基础,企业可以有效地使用这些解决方案。

培训不需要统计领域的复杂专业知识。当然,您应该意识到这样一个事实,即就其本质而言,培训期间提供的材料在某种程度上是技术性的。培训的目的是使参与者能够对 数据科学有有意义的理解,而不仅仅是对该领域的一般介绍。尽管有这个相当雄心勃勃的目标,但数学仪器被限制在绝对必要的最低限度。一般来说,培训包含理解和构建先进的、基于 数据的 业务问题解决方案所需的一切。

Overview:

数据科学 是一个新概念,它在很大程度上刷新了统计学的形象,尤其是商业分析,在人们的普遍理解中。畅销书 《信号与噪音》(The Signal and the Noise) 的作者内特·西尔弗(Nate Silver)说,这允许对统计学家的职业进行更“性感”的描述。业务分析也是如此。假设业务分析师没有注意到技术的进步并且不会随着时间的推移而发展,这是完全不合理的。出于广告目的,像数据科学这样在很大程度上是多余的术语非常有用,但让我们记住,商业分析师和统计学家长期以来一直在处理当今变得如此流行的问题,这主要是由于技术的进步。

Course Outline:

业务数据分析逻辑

1.1 数据使用的普遍性

1.2 两个例子——飓风和客户行为

1.3 数据科学、工程和数据驱动决策

1.4 数据处理和“Big Data”

1.5 Big Data 1.0 至 Big Data 2.0

1.6 作为战略资产的数据和数据分析

1.7 数据分析逻辑 – 总结

使用数据科学的业务问题和解决方案

2.1 从业务问题到数据挖掘

2.2 监督和无监督方法

2.3 数据挖掘及其结果

2.4 管理数据科学企业的后果

2.5 分析技术与技术

2.6 小结

预测建模 - 从相关性到监督分割

3.1 模型、归纳和预测

3.2 监督分割

3.3 可视化结果

3.4 树作为规则集

3.5 概率估计

3.6 案例研究

3.7 小结

将模型拟合到数据

4.1 使用数学函数进行分类

4.2 回归

4.3 类概率估计和逻辑“回归”

4.4 非线性函数

4.5 神经网络

4.6 小结

过拟合以及如何避免过拟合

5.1 泛化

5.2 过拟合

5.3 过拟合问题的分析

5.4 示例

5.5 避免过拟合的技术

5.6 学习曲线

5.7 复杂性控制

5.8 小结

相似性、邻接性和聚类

6.1 相似性和距离的测量

6.2 邻域和推理规则

6.3 关键技术

6.4 聚类分析

6.5 在解决业务问题中的应用

什么时候模型好?

7.1 模型评估中使用的分类器

7.2 跨越分类边界的概括

7.3 分析框架

7.4 使用基本评估技术的实例

7.5 小结

模型可视化

8.1 应用等级

8.2 利润曲线

8.3 接收机工作特性 (ROC) 曲线和图形

8.4 ROC曲线下面积

8.5 累积响应

8.6 示例

8.7 小结

证据和概率

9.1 示例 – 以客户为中心

9.2 概率证据组合

9.3 贝叶斯规则的应用

9.4 构建模型

9.5 模型应用实例

9.6 总结

表示和文本挖掘

10.1 为什么文本很重要?

10.2 为什么处理文本很困难?

10.3 表示

10.4 示例

10.5 熵和文本

10.6 这不是一堆话

10.7 消息探索

10.8 总结

分析工程案例研究

其他任务和技术

12.1 共现和关联

12.2 分析

12.3 关系预测

12.4 信息缩减和选择

12.5 失真、失真和方差

12.6 案例研究

12.7 小结

商业战略和数据科学

13.1 Redux

13.2 获得竞争优势

13.3 保持优势

13.4 资源获取

13.5 新思路与发展

13.6 组织的成熟度

如何进行数据科学项目评审

结论

Sites Published:

Polska - Data Science w biznesie