 
             
             
            客服微信

 
         学习人数:887
                学习人数:887
                 课程类型:认证培训
                
                    课程类型:认证培训
                                    
                 课时长度:4天/24 课时
                课时长度:4天/24 课时
             
                     
                Cloudera Apache Hadoop培训及认证帮助您进阶大数据知识及技能Cloudera大学为期4天的Hadoop管理员培训将帮助学员综合理解并全面掌握通过Cloudera Manager对Hadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训, Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。
	
 
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。
YARN、 MapReduce、 Spark及HDFS的工作原理。
如何为你的机群选取合适的硬件和架构。
如何将Hadoop机群和企业已有的系统进行无缝集成。
如何使用Flume进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。
如何配置公平调度器为Hadoop上的多用户提供服务级别保障。
	产品环境中Hadoop机群的最佳运维实践Hadoop机群排错、诊断问题和性能调优。
 
	
 
培训对象及学员基础
“面向系统管理员和IT经理,需具备Linux经验,无需Apache Hadoop基础。
	
 
认证
“结束本课程培训后,我们建议学员准备并注册参加Cloudera认证CCA Administrator管理员考试( CCA131 )。
通过并获取该证书是向公司及客户证明个人在Hadoop领域的技术和专长的有力依据
	
 
 Day 1
Day 1 第1课 Apache Hadoop 介绍
第1课 Apache Hadoop 介绍 
 • Hadoop 动机
 • Hadoop 动机 
 • 基本概念
 • 基本概念 
 • Hadoop 核心部件
 • Hadoop 核心部件 
 
 第2课 Hadoop 机群安装
第2课 Hadoop 机群安装 
 • 机群管理方案
• 机群管理方案 
 • Cloudera Manager 特性
• Cloudera Manager 特性 
 • Cloudera manager 安装
• Cloudera manager 安装 
 • Hadoop (CDH) 安装
• Hadoop (CDH) 安装 Day 2
Day 2 第3课 Hadoop 分布式文件系统 (HDFS)
第3课 Hadoop 分布式文件系统 (HDFS) 
 • HDFS 特性
• HDFS 特性 
 • 读写文件
• 读写文件 
 • NameNode 内存考虑
• NameNode 内存考虑 
 • HDFS 安全简介
• HDFS 安全简介 
 • HDFS Web UI
• HDFS Web UI 
 • 使用 HDFS Shell
• 使用 HDFS Shell 
 
 第4课 YARN 上的 MapReduce 和 Spark
第4课 YARN 上的 MapReduce 和 Spark 
 • 计算平台在 Hadoop 里扮演的角色
• 计算平台在 Hadoop 里扮演的角色 
 • YARN:机群资源管理器
• YARN:机群资源管理器 
 • MapReduce 概念
• MapReduce 概念 
 • Apache Spark 概念
• Apache Spark 概念 
 • Yarn 上的计算平台
• Yarn 上的计算平台 
 • YARN Web UI 及 Shell
• YARN Web UI 及 Shell 
 • YARN 应用运行日志
• YARN 应用运行日志 
 
 第5课 Hadoop 配置及服务运行日志
第5课 Hadoop 配置及服务运行日志 
 • Cloudera Manager 配置管理机制
• Cloudera Manager 配置管理机制 
 • 定位配置参数及进行配置变更
• 定位配置参数及进行配置变更 
 • 管理角色实例及添加服务
• 管理角色实例及添加服务 
 • 配置 HDFS 服务
• 配置 HDFS 服务 
 • 配置 Hadoop 服务运行日志
• 配置 Hadoop 服务运行日志 
 • 配置 YARN 服务
• 配置 YARN 服务 
 
 第6课 向 HDFS 导入数据
第6课 向 HDFS 导入数据 
 • 使用 Flume 从外部数据源实时导入数据
• 使用 Flume 从外部数据源实时导入数据 
 • 使用 Sqoop 从关系数据库导入数据
• 使用 Sqoop 从关系数据库导入数据 
 • REST 接口
• REST 接口 
 • 导入数据的最佳实践
• 导入数据的最佳实践 Day 3
Day 3 第7课 Hadoop 机群规划
第7课 Hadoop 机群规划 
 • 规划考虑因素
• 规划考虑因素 
 • 硬件选择
• 硬件选择 
 • 虚拟化选项
• 虚拟化选项 
 • 网络因素 • 节点配置
• 网络因素 • 节点配置 
 
 第8课 Hive,Impala 及 Pig 的安装及配置
第8课 Hive,Impala 及 Pig 的安装及配置 
 • Hive
• Hive 
 • Impala
• Impala 
 • Pig
• Pig 
 
 第9课 Hadoop 客户端及Hue
第9课 Hadoop 客户端及Hue 
 • 什么是 Hadoop 客户端
• 什么是 Hadoop 客户端 
 • 安装及配置 Hadoop 客户端
• 安装及配置 Hadoop 客户端 
 • 安装及配置 Hue
• 安装及配置 Hue 
 • 使用 Hue 进行身份验证及授权
• 使用 Hue 进行身份验证及授权 
 
 第10课 集群高级配置
第10课 集群高级配置 
 • 高级配置参数
• 高级配置参数 
 • Hadoop 端口配置
• Hadoop 端口配置 
 • HDFS 机柜感知配置
• HDFS 机柜感知配置 
 • HDFS 高可靠性配置
• HDFS 高可靠性配置 Day 4
Day 4 第11课 Hadoop 安全
第11课 Hadoop 安全 
 • Hadoop 安全的重要性
• Hadoop 安全的重要性 
 • Hadoop 安全性概念
• Hadoop 安全性概念 
 • Kerberos 简介
• Kerberos 简介 
 • 使用 Kerberos 保护Hadoop机群
• 使用 Kerberos 保护Hadoop机群 
 • 其他安全特性
• 其他安全特性 
 
 第12课 资源管理
第12课 资源管理 
 • 使用静态服务池配置 Linux cgroup
• 使用静态服务池配置 Linux cgroup 
 • 公平调度器 • 配置动态资源池
• 公平调度器 • 配置动态资源池 
 • YARN 内存及 CPU 设置
• YARN 内存及 CPU 设置 
 • Impala 查询调度
• Impala 查询调度 
 
 第13课 机群维护
第13课 机群维护 
 • 检查 HDFS 状态
• 检查 HDFS 状态 
 • 机群间复制数据
• 机群间复制数据 
 • 添加/移除机群节点
• 添加/移除机群节点 
 • 机群数据负载平衡
• 机群数据负载平衡 
 • 目录快照 • 机群升级
• 目录快照 • 机群升级 
 
 第14课 机群监控及排错
第14课 机群监控及排错 
 • Cloudera Manager 监控特性
• Cloudera Manager 监控特性 
 • 监控 Hadoop 机群
• 监控 Hadoop 机群 
 • Hadoop 机群排错
• Hadoop 机群排错 
 • 常见配置不当问题
• 常见配置不当问题 
            郭一军
云贝教育创始人 腾讯云TVP PostgreSQL ACE总监