Course Code:
paadva2
Duration:
16 hours
Course Outline:
模组 1:使用 DataFrame 的 Pandas 功能
- 介绍 Pandas
- 核心数据结构:序列和数据帧
- DataFrame 操作
- 载入和储存资料(CSV、Excel 等)
- 基本操作(选择、筛选、索引)
- 资料修改
- 添加、删除列和行
- 修改 DataFrame 中的值
- 数据聚合和分组
- 分组依据
- 聚合、求和、平均值等
- 合并和合并 DataFrame
- 合并、加入、连接
- 处理缺失数据
- 识别缺失数据
- 填写缺失数据的方法
模组 2:程式时间优化
- 优化简介
- 优化在程式设计中的重要性
- 代码优化
- 高效的数据结构
- 避免重复计算
- 循环优化
- 优化 Pandas
- 操作的矢量化
- 避免 apply 和 lambda
- 使用大数据
- 通过创建函数简化代码
- 建立和使用功能
- 代码重构
模组 3:使用 numpy
- NumPy 简介
- 导入库
- 基本数据结构:ndarray
- Board 上的操作
- 建立和修改板
- 阵列索引和切片
- 数学和统计函数
- 基本数学运算
- 统计和聚合函数
-线性代数
- 矩阵乘法
- 行列式,逆矩阵
- 使用多维数据
- 2D、3D 和更高维阵列
- 变换阵列的形状
- 与其他库集成
模组 4:使用 Pythona 在 Excelu 中创建图形
- openpyxl 和 xlsxwriter 简介
- 在 Excelu 中创建图形
- 建立简单的图表(折线图、条形图等)
- 图表格式
- 将图表生成为影像 (PNG)
- 使用 matplotlib 产生绘图
- 将图表另存为 PNG 档
- Excelu 中的高级图表
- 自动化报告
- 使用图表创建自动报告
- 将 Pandas 与 openpyxl/xlsxwriter 连结