Course Code:
rlang
Duration:
21 hours
Overview:
R是一種用於統計計算,數據分析和圖形的開源免費編程語言。 R被企業和學術界內越來越多的經理和數據分析師使用。 R還發現沒有計算機編程技能的統計學家,工程師和科學家的追隨者都很容易使用。它的受歡迎程度是由於越來越多地使用數據挖掘來實現各種目標,例如設定廣告價格,更快地找到新藥或微調財務模型。 R有各種各樣的數據挖掘包。
Course Outline:
第1天
引言和序言
- 使 R 更友好,R 和可用的 GUI
- R工作室
- Related 軟體和文檔
- R 和統計數據
- 以交互方式使用 R
- 介紹性會議
- 獲取有關功能和特性的説明
- R 命令、區分大小寫等
- ReCall 和更正先前的命令
- 從檔案執行命令或將輸出轉移到檔中
- 數據持久性和刪除物件
簡單的操作;數位和向量
- 向量和賦值
- 向量算術
- 生成常規序列
- 邏輯向量
- 缺失值
- 字元向量
- 索引向量;選擇和修改數據集的子集
- 其他類型的物件
對象、它們的模式和屬性
- 內在屬性:模式和長度
- 更改物件的長度
- 獲取和設置屬性
- 物件的類
有序因數和無序因數
- 具體示例
- 函數 tapply() 和不規則數位
- 有序因數
陣列和矩陣
- 陣 列
- 陣列索引。陣列的子節
- 索引矩陣
- array() 函數
- 混合向量和數位算術。回收規則
- 兩個陣列的外積
- 陣列的廣義轉置
- Matrix 設施
- Matrix 乘法
- 線性方程和反演
- 特徵值和特徵向量
- 奇異值分解和行列式
- 最小二乘擬合和 QR 分解
- 形成分區矩陣 cbind() 和 rbind()
- 包含陣列的串聯函數 ()
- 因數的頻率表
第2天
清單和數據框
- 清單
- 構建和修改清單
- 連接清單
- 數據幀
- 製作數據框
- attach() 和 detach()
- 使用數據框
- 附加任意清單
- 管理搜尋路徑
數據操作
- 選擇、子集化觀測值和變數
- 篩選、分組
- Recoding, 轉換
- 聚合,組合數據集
- 字元操作、stringr 包
R數據
- Txt 檔
- CSV 檔
- XLS、XLSX 檔
- SPSS, SAS, Stata,...和其他格式數據
- 將數據匯出為 txt、csv 和其他格式
- Access使用 SQL 語言從資料庫獲取數據
概率分佈
- R 作為一組統計表
- 檢查一組數據的分佈
- 單樣本和雙樣本檢測
分組、循環和條件執行
- 分組表達式
- 控制語句
- 條件執行:if 語句
- R重複執行:for 迴圈、repeat 和 while
第3天
編寫自己的函數
- 簡單示例
- 定義新的二元運算符
- 命名參數和預設值
- “...”論點
- 函數內的賦值
- 更高級的範例
- 模組設計中的效率係數
- 刪除列印陣列中的所有名稱
- R遞歸數值積分
- 範圍
- 自定義環境
- 類、泛型函數和面向物件
R 中的統計分析
- 線性回歸模型
- 用於提取模型資訊的通用函數
- 更新擬合模型
- 廣義線性模型
- 家族
- glm() 函數
- 分類
- Logistic R 出口
- 線性判別分析
- 無監督學習
- 主成分分析
- 聚類方法(k-means、分層聚類、k-medoids)
- 生存分析
- r 中的生存物件
- Kaplan-Meier 估計值
- 置信區間
- Cox PH 模型,常數協變數
- Cox PH 模型,瞬態協變數
圖形過程
- 高級繪圖命令
- plot() 函數
- 顯示多變數數據
- 顯示圖形
- 高級繪圖函數的參數
- 基本可視化圖表
- 使用 lattice 和 ggplot 包的多元關係
- 使用圖形參數
- 圖形參數清單
自動化和互動式報告
- 將 R 的輸出與文本合併
創建 html、pdf 文件
Sites Published: