Course Code: spmllib
Duration: 35 hours
Prerequisites:

瞭解以下其中一項知識:

  • 爪哇島
  • Scala
  • 火花R。
Overview:

MLlib是Spark的機器學習(ML)庫。其目標是使實用的機器學習可擴展且簡單。它由常見的學習算法和實用程序組成,包括分類,回歸,聚類,協同過濾,降維,以及低級優化原語和更高級別的管道API。

它分為兩個包:

  • spark.mllib包含在RDD之上構建的原始API。

  • spark.ml提供了構建在DataFrame之上的更高級API,用於構建ML管道。

聽眾

本課程面向希望利用Apache Spark內置機器庫的工程師和開發人員

Course Outline:

spark.mllib:數據類型、演算法和實用程式

  • 數據類型
  • 基本統計數據
    • 匯總統計數據
    • 相關性
    • 分層抽樣
    • 假設檢驗
    • 流顯著性檢驗
    • 隨機數據生成
  • 分類和回歸
    • 線性模型(SVM、邏輯回歸、線性回歸)
    • 樸素貝葉斯
    • 決策樹
    • 樹的系綜(Random Forest 和 Gradient-Boosted Trees)
    • 等滲回歸
  • 協同過濾
    • 交替最小二乘法 (ALS)
  • 聚類
    • k 均值
    • 高斯混合物
    • 冪反覆運算集群 (PIC)
    • 潛在狄利克雷分配 (LDA)
    • 將 k 均值一分為二
    • 流式處理 K-Means
  • 降維
    • 奇異值分解 (SVD)
    • 主成分分析 (PCA)
  • 特徵提取和轉換
  • 頻繁的模式挖掘
    • FP 增長
    • 關聯規則
    • 前綴跨度
  • 評估指標
  • PMML 模型導出
  • 優化(開發者)
    • 隨機梯度下降
    • 記憶體受限 BFGS (L-BFGS)

spark.ml:ML 管道的高級 API

  • 概述:估算器、轉換器和管道
  • 提取、轉換和選擇特徵
  • 分類和回歸
  • 聚類
  • 高級主題
Sites Published:

United Arab Emirates - Apache Spark MLlib

Qatar - Apache Spark MLlib

Egypt - Apache Spark MLlib

Saudi Arabia - Apache Spark MLlib

South Africa - Apache Spark MLlib

Brasil - Apache Spark MLlib

Canada - Apache Spark MLlib

中国 - Apache Spark MLlib

香港 - Apache Spark MLlib

澳門 - Apache Spark MLlib

台灣 - Apache Spark MLlib

USA - Apache Spark MLlib

Österreich - Apache Spark MLlib

Schweiz - Apache Spark MLlib

Deutschland - Apache Spark MLlib

Czech Republic - Apache Spark MLlib

Denmark - Apache Spark MLlib

Estonia - Apache Spark MLlib

Finland - Apache Spark MLlib

Greece - Apache Spark MLlib

Magyarország - Apache Spark MLlib

Ireland - Apache Spark MLlib

Luxembourg - Apache Spark MLlib

Latvia - Apache Spark MLlib

España - Apache Spark MLlib

Italia - Apache Spark MLlib

Lithuania - Apache Spark MLlib

Nederland - Apache Spark MLlib

Norway - Apache Spark MLlib

Portugal - Apache Spark MLlib

România - Apache Spark MLlib

Sverige - Apache Spark MLlib

Türkiye - Apache Spark MLlib

Malta - Apache Spark MLlib

Belgique - Apache Spark MLlib

France - Apache Spark MLlib

日本 - Apache Spark MLlib

Australia - Apache Spark MLlib

Malaysia - Apache Spark MLlib

New Zealand - Apache Spark MLlib

Philippines - Apache Spark MLlib

Singapore - Apache Spark MLlib

Thailand - Apache Spark MLlib

Vietnam - Apache Spark MLlib

India - Apache Spark MLlib

Argentina - Apache Spark MLlib

Chile - Apache Spark MLlib

Costa Rica - Apache Spark MLlib

Ecuador - Apache Spark MLlib

Guatemala - Apache Spark MLlib

Colombia - Apache Spark MLlib

México - Apache Spark MLlib

Panama - Apache Spark MLlib

Peru - Apache Spark MLlib

Uruguay - Apache Spark MLlib

Venezuela - Apache Spark MLlib

Polska - Apache Spark MLlib

United Kingdom - Apache Spark MLlib

South Korea - Apache Spark MLlib

Pakistan - Apache Spark MLlib

Sri Lanka - Apache Spark MLlib

Bulgaria - Apache Spark MLlib

Bolivia - Apache Spark MLlib

Indonesia - Apache Spark MLlib

Kazakhstan - Apache Spark MLlib

Moldova - Apache Spark MLlib

Morocco - Apache Spark MLlib

Tunisia - Apache Spark MLlib

Kuwait - Apache Spark MLlib

Oman - Apache Spark MLlib

Slovakia - Apache Spark MLlib

Kenya - Apache Spark MLlib

Nigeria - Apache Spark MLlib

Botswana - Apache Spark MLlib

Slovenia - Apache Spark MLlib

Croatia - Apache Spark MLlib

Serbia - Apache Spark MLlib

Bhutan - Apache Spark MLlib

Nepal - Apache Spark MLlib

Uzbekistan - Apache Spark MLlib