Course Code: matlabds
Duration: 35 hours
Prerequisites:
  • 了解線性代數、概率論、統計學等基本數學概念
  • 不需有MATLAB的經驗
Overview:

本次培訓的第一部分介紹了MATLAB的基本原理及其作爲語言和平台的功能。本次討論包括MATLAB語法、數組和矩陣、數據可視化、腳本開發及面向對象原理的介紹。

在第二部分中,我們演示如何使用MATLAB進行數據挖掘,重點是數據建模和機器學習。

在整個課程中,參與者將在實驗室環境裏把通過動手練習學到的想法付諸實踐。培訓結束後,參與者將對MATLAB的功能有一個全面的了解,並將能夠用它來解決實際的數據科學問題。

整個課程中將進行評估以衡量進度。

課程形式

  • 課程包含理論和實踐練習,包括案例討論、樣本代碼檢查和實操。
Course Outline:

介紹
MATLAB:用于數據挖掘

第01部分:MATLAB基礎

概覽
    MATLAB用于數據分析、可視化、建模、編程。

使用MATLAB用戶界面

MATLAB語法概述

輸入命令
    使用命令行界面

創建變量
    數字與字符數據

分析向量和矩陣
    創建和操作
    執行計算

可視化矢量和矩陣數據

使用數據文件
    從Excel電子表格導入數據

處理數據類型
    使用表格數據

使用腳本自動執行命令
    創建和運行腳本
    組織和發布您的腳本

用分支和循環編寫程序
    用戶交互和流控制(flow control)

寫作功能
    創建和調用函數
    使用MATLAB編輯器進行調試

將面向對象的編程原則應用到您的程序中

第02部分:MATLAB用于數據挖掘

概覽
    MATLAB用于數據挖掘、機器學習、預測性分析

使用統計和機器學習工具箱

訪問數據
    從文件、電子表格、數據庫中獲取數據
    從測試設備和硬件獲取數據
    從軟件和Web獲取數據

預處理數據(縮減、轉換、特征提取)
    主成分分析(PCA)和偏最小二乘法(PLS)

探索數據
    識別趨勢、測試假設、估計不確定性

分割數據
   用K-means聚類

回歸分析

機器學習
     有監督和無監督的機器學習算法

創建自定義算法

建模數據

生成.mat文件

創建可視化

發布報告

共享分析工具
    作爲MATLAB代碼
    作爲獨立的桌面或Web應用程序

總結和結束語