Course Code:
rlang
Duration:
21 hours
Overview:
R是一种用于统计计算,数据分析和图形的开源免费编程语言。 R被企业和学术界内越来越多的经理和数据分析师使用。 R还发现没有计算机编程技能的统计学家,工程师和科学家的追随者都很容易使用。它的受欢迎程度是由于越来越多地使用数据挖掘来实现各种目标,例如设定广告价格,更快地找到新药或微调财务模型。 R有各种各样的数据挖掘包。
Course Outline:
第1天
引言和序言
- 使 R 更友好,R 和可用的 GUI
- R工作室
- Related 软体和文档
- R 和统计数据
- 以交互方式使用 R
- 介绍性会议
- 获取有关功能和特性的说明
- R 命令、区分大小写等
- ReCall 和更正先前的命令
- 从档案执行命令或将输出转移到档中
- 数据持久性和删除物件
简单的操作;数位和向量
- 向量和赋值
- 向量算术
- 生成常规序列
- 逻辑向量
- 缺失值
- 字元向量
- 索引向量;选择和修改数据集的子集
- 其他类型的物件
对象、它们的模式和属性
- 内在属性:模式和长度
- 更改物件的长度
- 获取和设置属性
- 物件的类
有序因数和无序因数
- 具体示例
- 函数 tapply() 和不规则数位
- 有序因数
阵列和矩阵
- 阵 列
- 阵列索引。阵列的子节
- 索引矩阵
- array() 函数
- 混合向量和数位算术。回收规则
- 两个阵列的外积
- 阵列的广义转置
- Matrix 设施
- Matrix 乘法
- 线性方程和反演
- 特征值和特征向量
- 奇异值分解和行列式
- 最小二乘拟合和 QR 分解
- 形成分区矩阵 cbind() 和 rbind()
- 包含阵列的串联函数 ()
- 因数的频率表
第2天
清单和数据框
- 清单
- 构建和修改清单
- 连接清单
- 数据帧
- 制作数据框
- attach() 和 detach()
- 使用数据框
- 附加任意清单
- 管理搜寻路径
数据操作
- 选择、子集化观测值和变数
- 筛选、分组
- Recoding, 转换
- 聚合,组合数据集
- 字元操作、stringr 包
R数据
- Txt 档
- CSV 档
- XLS、XLSX 档
- SPSS, SAS, Stata,...和其他格式数据
- 将数据汇出为 txt、csv 和其他格式
- Access使用 SQL 语言从资料库获取数据
概率分布
- R 作为一组统计表
- 检查一组数据的分布
- 单样本和双样本检测
分组、循环和条件执行
- 分组表达式
- 控制语句
- 条件执行:if 语句
- R重复执行:for 回圈、repeat 和 while
第3天
编写自己的函数
- 简单示例
- 定义新的二元运算符
- 命名参数和预设值
- “...”论点
- 函数内的赋值
- 更高级的范例
- 模组设计中的效率系数
- 删除列印阵列中的所有名称
- R递归数值积分
- 范围
- 自定义环境
- 类、泛型函数和面向物件
R 中的统计分析
- 线性回归模型
- 用于提取模型资讯的通用函数
- 更新拟合模型
- 广义线性模型
- 家族
- glm() 函数
- 分类
- Logistic R 出口
- 线性判别分析
- 无监督学习
- 主成分分析
- 聚类方法(k-means、分层聚类、k-medoids)
- 生存分析
- r 中的生存物件
- Kaplan-Meier 估计值
- 置信区间
- Cox PH 模型,常数协变数
- Cox PH 模型,瞬态协变数
图形过程
- 高级绘图命令
- plot() 函数
- 显示多变数数据
- 显示图形
- 高级绘图函数的参数
- 基本可视化图表
- 使用 lattice 和 ggplot 包的多元关系
- 使用图形参数
- 图形参数清单
自动化和互动式报告
- 将 R 的输出与文本合并
创建 html、pdf 文件
Sites Published: