Course Code: hadoopadm1
Duration: 21 hours
Prerequisites:
  • 熟悉基本的Linux系统管理
  • 具备基本的脚本编写技能

不需要具备Hadoop和分布式计算的知识,课程中会介绍并解释这些内容。

实验环境

零安装:无需在学生机器上安装hadoop软件!将为学生们提供一个可用的hadoop集群。

学生需要准备以下内容:

  • 一个SSH客户端(Linux和Mac系统已自带ssh客户端,Windows系统推荐使用Putty)
  • 一个用于访问集群的浏览器。推荐使用安装了FoxyProxy扩展的Firefox浏览器
Overview:

Apache Hadoop 是最流行的用于在服务器集群上处理 Big Data 的框架。在这个为期三(可选四)天的课程中,学员将了解 Hadoop 及其生态系统的商业优势和用例,如何规划集群的部署和扩展,如何安装、维护、监控、故障排除和优化 Hadoop。他们还将练习集群批量数据加载,熟悉各种 Hadoop 发行版,并练习安装和管理 Hadoop 生态系统工具。课程最后将讨论如何使用 Kerberos 保护集群。

“……材料准备得非常充分,涵盖全面。实验室非常有帮助且组织有序。” — Andrew Nguyen, 首席集成数据仓库工程师, Microsoft 线上 Advertising

受众

Hadoop 管理员

形式

讲座与动手实验,大致比例为 60% 讲座,40% 实验。

Course Outline:
  • 简介
    • Hadoop 历史与概念
    • 生态系统
    • 发行版
    • 高层架构
    • Hadoop 常见误解
    • Hadoop 挑战(硬件/软件)
    • 实验:讨论您的 Big Data 项目与问题
  • 规划与安装
    • 选择软件与 Hadoop 发行版
    • 集群规模规划与扩展计划
    • 选择硬件与网络
    • 机架拓扑
    • 安装
    • 多租户
    • 目录结构与日志
    • 基准测试
    • 实验:集群安装与性能基准测试
  • HDFS 操作
    • 概念(水平扩展、数据复制、数据本地性、机架感知)
    • 节点与守护进程(NameNode、Secondary NameNode、HA Standby NameNode、DataNode)
    • 健康监控
    • 命令行与基于浏览器的管理
    • 添加存储、更换故障驱动器
    • 实验:熟悉 HDFS 命令行
  • 数据摄取
    • 使用 Flume 将日志与其他数据摄取到 HDFS
    • 使用 Sqoop 从 SQL 数据库导入到 HDFS,以及导回 SQL
    • Hadoop 数据仓库与 Hive
    • 集群间数据复制(distcp)
    • 使用 S3 作为 HDFS 的补充
    • 数据摄取最佳实践与架构
    • 实验:设置与使用 Flume,同样适用于 Sqoop
  • MapReduce 操作与管理
    • MapReduce 之前的并行计算:比较 HPC 与 Hadoop 管理
    • MapReduce 集群负载
    • 节点与守护进程(JobTracker、TaskTracker)
    • MapReduce 用户界面浏览
    • MapReduce 配置
    • 作业配置
    • MapReduce 优化
    • MapReduce 防错:程序员须知
    • 实验:运行 MapReduce 示例
  • YARN:新架构与新功能
    • YARN 设计目标与实现架构
    • 新角色:ResourceManager、NodeManager、Application Master
    • 安装 YARN
    • YARN 下的作业调度
    • 实验:研究作业调度
  • 高级主题
    • 硬件监控
    • 集群监控
    • 添加与移除服务器,升级 Hadoop
    • 备份、恢复与业务连续性规划
    • Oozie 作业工作流
    • Hadoop 高可用性(HA)
    • Hadoop 联邦
    • 使用 Kerberos 保护集群
    • 实验:设置监控
  • 可选轨道
    • Cloudera Manager 用于集群管理、监控与日常任务;安装与使用。在此轨道中,所有练习与实验均在 Cloudera 发行版环境(CDH5)中进行。
    • Ambari 用于集群管理、监控与日常任务;安装与使用。在此轨道中,所有练习与实验均在 Ambari 集群管理器与 Hortonworks 数据平台(HDP 2.0)中进行。
Sites Published:

United Arab Emirates - Hadoop For Administrators

Qatar - Hadoop For Administrators

Egypt - Hadoop For Administrators

Saudi Arabia - Hadoop For Administrators

South Africa - Hadoop For Administrators

Brasil - Hadoop For Administrators

Canada - Hadoop For Administrators

中国 - Hadoop For Administrators

香港 - Hadoop For Administrators

澳門 - Hadoop For Administrators

台灣 - Hadoop For Administrators

USA - Hadoop For Administrators

Österreich - Hadoop For Administrators

Schweiz - Hadoop For Administrators

Deutschland - Hadoop For Administrators

Czech Republic - Hadoop For Administrators

Denmark - Hadoop For Administrators

Estonia - Hadoop For Administrators

Finland - Hadoop For Administrators

Greece - Hadoop For Administrators

Magyarország - Hadoop For Administrators

Ireland - Hadoop For Administrators

Luxembourg - Hadoop For Administrators

Latvia - Hadoop For Administrators

España - Hadoop para Administradores

Italia - Hadoop For Administrators

Lithuania - Hadoop For Administrators

Nederland - Hadoop For Administrators

Norway - Hadoop For Administrators

Portugal - Hadoop For Administrators

România - Hadoop For Administrators

Sverige - Hadoop For Administrators

Türkiye - Hadoop For Administrators

Malta - Hadoop For Administrators

Belgique - Hadoop pour Administrateurs

France - Hadoop pour Administrateurs

日本 - Hadoop For Administrators

Australia - Hadoop For Administrators

Malaysia - Hadoop For Administrators

New Zealand - Hadoop For Administrators

Philippines - Hadoop For Administrators

Singapore - Hadoop For Administrators

Thailand - Hadoop For Administrators

Vietnam - Hadoop For Administrators

India - Hadoop For Administrators

Argentina - Hadoop para Administradores

Chile - Hadoop para Administradores

Costa Rica - Hadoop para Administradores

Ecuador - Hadoop para Administradores

Guatemala - Hadoop para Administradores

Colombia - Hadoop para Administradores

México - Hadoop para Administradores

Panama - Hadoop para Administradores

Peru - Hadoop para Administradores

Uruguay - Hadoop para Administradores

Venezuela - Hadoop para Administradores

Polska - Hadoop For Administrators

United Kingdom - Hadoop For Administrators

South Korea - Hadoop For Administrators

Pakistan - Hadoop For Administrators

Sri Lanka - Hadoop For Administrators

Bulgaria - Hadoop For Administrators

Bolivia - Hadoop para Administradores

Indonesia - Hadoop For Administrators

Kazakhstan - Hadoop For Administrators

Moldova - Hadoop For Administrators

Morocco - Hadoop For Administrators

Tunisia - Hadoop For Administrators

Kuwait - Hadoop For Administrators

Oman - Hadoop For Administrators

Slovakia - Hadoop For Administrators

Kenya - Hadoop For Administrators

Nigeria - Hadoop For Administrators

Botswana - Hadoop For Administrators

Slovenia - Hadoop For Administrators

Croatia - Hadoop For Administrators

Serbia - Hadoop For Administrators

Bhutan - Hadoop For Administrators

Nepal - Hadoop For Administrators

Uzbekistan - Hadoop For Administrators