Course Code: spmllib
Duration: 35 hours
Prerequisites:

了解以下其中一项知识:

  • 爪哇岛
  • Scala
  • 火花R。
Overview:

MLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且简单。它由常见的学习算法和实用程序组成,包括分类,回归,聚类,协同过滤,降维,以及低级优化原语和更高级别的管道API。

它分为两个包:

  • spark.mllib包含在RDD之上构建的原始API。

  • spark.ml提供了构建在DataFrame之上的更高级API,用于构建ML管道。

听众

本课程面向希望利用Apache Spark内置机器库的工程师和开发人员

Course Outline:

spark.mllib:数据类型、演算法和实用程式

  • 数据类型
  • 基本统计数据
    • 汇总统计数据
    • 相关性
    • 分层抽样
    • 假设检验
    • 流显著性检验
    • 随机数据生成
  • 分类和回归
    • 线性模型(SVM、逻辑回归、线性回归)
    • 朴素贝叶斯
    • 决策树
    • 树的系综(Random Forest 和 Gradient-Boosted Trees)
    • 等渗回归
  • 协同过滤
    • 交替最小二乘法 (ALS)
  • 聚类
    • k 均值
    • 高斯混合物
    • 幂反复运算集群 (PIC)
    • 潜在狄利克雷分配 (LDA)
    • 将 k 均值一分为二
    • 流式处理 K-Means
  • 降维
    • 奇异值分解 (SVD)
    • 主成分分析 (PCA)
  • 特征提取和转换
  • 频繁的模式挖掘
    • FP 增长
    • 关联规则
    • 前缀跨度
  • 评估指标
  • PMML 模型导出
  • 优化(开发者)
    • 随机梯度下降
    • 记忆体受限 BFGS (L-BFGS)

spark.ml:ML 管道的高级 API

  • 概述:估算器、转换器和管道
  • 提取、转换和选择特征
  • 分类和回归
  • 聚类
  • 高级主题
Sites Published:

United Arab Emirates - Apache Spark MLlib

Qatar - Apache Spark MLlib

Egypt - Apache Spark MLlib

Saudi Arabia - Apache Spark MLlib

South Africa - Apache Spark MLlib

Brasil - Apache Spark MLlib

Canada - Apache Spark MLlib

中国 - Apache Spark MLlib

香港 - Apache Spark MLlib

澳門 - Apache Spark MLlib

台灣 - Apache Spark MLlib

USA - Apache Spark MLlib

Österreich - Apache Spark MLlib

Schweiz - Apache Spark MLlib

Deutschland - Apache Spark MLlib

Czech Republic - Apache Spark MLlib

Denmark - Apache Spark MLlib

Estonia - Apache Spark MLlib

Finland - Apache Spark MLlib

Greece - Apache Spark MLlib

Magyarország - Apache Spark MLlib

Ireland - Apache Spark MLlib

Luxembourg - Apache Spark MLlib

Latvia - Apache Spark MLlib

España - Apache Spark MLlib

Italia - Apache Spark MLlib

Lithuania - Apache Spark MLlib

Nederland - Apache Spark MLlib

Norway - Apache Spark MLlib

Portugal - Apache Spark MLlib

România - Apache Spark MLlib

Sverige - Apache Spark MLlib

Türkiye - Apache Spark MLlib

Malta - Apache Spark MLlib

Belgique - Apache Spark MLlib

France - Apache Spark MLlib

日本 - Apache Spark MLlib

Australia - Apache Spark MLlib

Malaysia - Apache Spark MLlib

New Zealand - Apache Spark MLlib

Philippines - Apache Spark MLlib

Singapore - Apache Spark MLlib

Thailand - Apache Spark MLlib

Vietnam - Apache Spark MLlib

India - Apache Spark MLlib

Argentina - Apache Spark MLlib

Chile - Apache Spark MLlib

Costa Rica - Apache Spark MLlib

Ecuador - Apache Spark MLlib

Guatemala - Apache Spark MLlib

Colombia - Apache Spark MLlib

México - Apache Spark MLlib

Panama - Apache Spark MLlib

Peru - Apache Spark MLlib

Uruguay - Apache Spark MLlib

Venezuela - Apache Spark MLlib

Polska - Apache Spark MLlib

United Kingdom - Apache Spark MLlib

South Korea - Apache Spark MLlib

Pakistan - Apache Spark MLlib

Sri Lanka - Apache Spark MLlib

Bulgaria - Apache Spark MLlib

Bolivia - Apache Spark MLlib

Indonesia - Apache Spark MLlib

Kazakhstan - Apache Spark MLlib

Moldova - Apache Spark MLlib

Morocco - Apache Spark MLlib

Tunisia - Apache Spark MLlib

Kuwait - Apache Spark MLlib

Oman - Apache Spark MLlib

Slovakia - Apache Spark MLlib

Kenya - Apache Spark MLlib

Nigeria - Apache Spark MLlib

Botswana - Apache Spark MLlib

Slovenia - Apache Spark MLlib

Croatia - Apache Spark MLlib

Serbia - Apache Spark MLlib

Bhutan - Apache Spark MLlib

Nepal - Apache Spark MLlib

Uzbekistan - Apache Spark MLlib