- 熟悉基本的Linux系统管理
- 具备基本的脚本编写技能
不需要具备Hadoop和分布式计算的知识,课程中会介绍并解释这些内容。
实验环境
零安装:无需在学生机器上安装hadoop软件!将为学生们提供一个可用的hadoop集群。
学生需要准备以下内容:
- 一个SSH客户端(Linux和Mac系统已自带ssh客户端,Windows系统推荐使用Putty)
- 一个用于访问集群的浏览器。推荐使用安装了FoxyProxy扩展的Firefox浏览器
Apache Hadoop 是最流行的用于在服务器集群上处理 Big Data 的框架。在这个为期三(可选四)天的课程中,学员将了解 Hadoop 及其生态系统的商业优势和用例,如何规划集群的部署和扩展,如何安装、维护、监控、故障排除和优化 Hadoop。他们还将练习集群批量数据加载,熟悉各种 Hadoop 发行版,并练习安装和管理 Hadoop 生态系统工具。课程最后将讨论如何使用 Kerberos 保护集群。
“……材料准备得非常充分,涵盖全面。实验室非常有帮助且组织有序。” — Andrew Nguyen, 首席集成数据仓库工程师, Microsoft 线上 Advertising
受众
Hadoop 管理员
形式
讲座与动手实验,大致比例为 60% 讲座,40% 实验。
-
简介
- Hadoop 历史与概念
- 生态系统
- 发行版
- 高层架构
- Hadoop 常见误解
- Hadoop 挑战(硬件/软件)
- 实验:讨论您的 Big Data 项目与问题
-
规划与安装
- 选择软件与 Hadoop 发行版
- 集群规模规划与扩展计划
- 选择硬件与网络
- 机架拓扑
- 安装
- 多租户
- 目录结构与日志
- 基准测试
- 实验:集群安装与性能基准测试
-
HDFS 操作
- 概念(水平扩展、数据复制、数据本地性、机架感知)
- 节点与守护进程(NameNode、Secondary NameNode、HA Standby NameNode、DataNode)
- 健康监控
- 命令行与基于浏览器的管理
- 添加存储、更换故障驱动器
- 实验:熟悉 HDFS 命令行
-
数据摄取
- 使用 Flume 将日志与其他数据摄取到 HDFS
- 使用 Sqoop 从 SQL 数据库导入到 HDFS,以及导回 SQL
- Hadoop 数据仓库与 Hive
- 集群间数据复制(distcp)
- 使用 S3 作为 HDFS 的补充
- 数据摄取最佳实践与架构
- 实验:设置与使用 Flume,同样适用于 Sqoop
-
MapReduce 操作与管理
- MapReduce 之前的并行计算:比较 HPC 与 Hadoop 管理
- MapReduce 集群负载
- 节点与守护进程(JobTracker、TaskTracker)
- MapReduce 用户界面浏览
- MapReduce 配置
- 作业配置
- MapReduce 优化
- MapReduce 防错:程序员须知
- 实验:运行 MapReduce 示例
-
YARN:新架构与新功能
- YARN 设计目标与实现架构
- 新角色:ResourceManager、NodeManager、Application Master
- 安装 YARN
- YARN 下的作业调度
- 实验:研究作业调度
-
高级主题
- 硬件监控
- 集群监控
- 添加与移除服务器,升级 Hadoop
- 备份、恢复与业务连续性规划
- Oozie 作业工作流
- Hadoop 高可用性(HA)
- Hadoop 联邦
- 使用 Kerberos 保护集群
- 实验:设置监控
-
可选轨道
- Cloudera Manager 用于集群管理、监控与日常任务;安装与使用。在此轨道中,所有练习与实验均在 Cloudera 发行版环境(CDH5)中进行。
- Ambari 用于集群管理、监控与日常任务;安装与使用。在此轨道中,所有练习与实验均在 Ambari 集群管理器与 Hortonworks 数据平台(HDP 2.0)中进行。
United Arab Emirates - Hadoop For Administrators
Qatar - Hadoop For Administrators
Egypt - Hadoop For Administrators
Saudi Arabia - Hadoop For Administrators
South Africa - Hadoop For Administrators
Brasil - Hadoop For Administrators
Canada - Hadoop For Administrators
中国 - Hadoop For Administrators
香港 - Hadoop For Administrators
澳門 - Hadoop For Administrators
台灣 - Hadoop For Administrators
USA - Hadoop For Administrators
Österreich - Hadoop For Administrators
Schweiz - Hadoop For Administrators
Deutschland - Hadoop For Administrators
Czech Republic - Hadoop For Administrators
Denmark - Hadoop For Administrators
Estonia - Hadoop For Administrators
Finland - Hadoop For Administrators
Greece - Hadoop For Administrators
Magyarország - Hadoop For Administrators
Ireland - Hadoop For Administrators
Luxembourg - Hadoop For Administrators
Latvia - Hadoop For Administrators
España - Hadoop para Administradores
Italia - Hadoop For Administrators
Lithuania - Hadoop For Administrators
Nederland - Hadoop For Administrators
Norway - Hadoop For Administrators
Portugal - Hadoop For Administrators
România - Hadoop For Administrators
Sverige - Hadoop For Administrators
Türkiye - Hadoop For Administrators
Malta - Hadoop For Administrators
Belgique - Hadoop pour Administrateurs
France - Hadoop pour Administrateurs
日本 - Hadoop For Administrators
Australia - Hadoop For Administrators
Malaysia - Hadoop For Administrators
New Zealand - Hadoop For Administrators
Philippines - Hadoop For Administrators
Singapore - Hadoop For Administrators
Thailand - Hadoop For Administrators
Vietnam - Hadoop For Administrators
India - Hadoop For Administrators
Argentina - Hadoop para Administradores
Chile - Hadoop para Administradores
Costa Rica - Hadoop para Administradores
Ecuador - Hadoop para Administradores
Guatemala - Hadoop para Administradores
Colombia - Hadoop para Administradores
México - Hadoop para Administradores
Panama - Hadoop para Administradores
Peru - Hadoop para Administradores
Uruguay - Hadoop para Administradores
Venezuela - Hadoop para Administradores
Polska - Hadoop For Administrators
United Kingdom - Hadoop For Administrators
South Korea - Hadoop For Administrators
Pakistan - Hadoop For Administrators
Sri Lanka - Hadoop For Administrators
Bulgaria - Hadoop For Administrators
Bolivia - Hadoop para Administradores
Indonesia - Hadoop For Administrators
Kazakhstan - Hadoop For Administrators
Moldova - Hadoop For Administrators
Morocco - Hadoop For Administrators
Tunisia - Hadoop For Administrators
Kuwait - Hadoop For Administrators
Oman - Hadoop For Administrators
Slovakia - Hadoop For Administrators
Kenya - Hadoop For Administrators
Nigeria - Hadoop For Administrators
Botswana - Hadoop For Administrators
Slovenia - Hadoop For Administrators
Croatia - Hadoop For Administrators
Serbia - Hadoop For Administrators
Bhutan - Hadoop For Administrators