集团站切换校区

验证码已发送,请查收短信

HCIE- - Big Data 技能班

面议

在线班远程课程、云实验平台、在线答疑

面授班资深讲师面授、真机实验、一对一解答

全套服务(在线、面授均享) 1.先学后付 2.定制课程 3.名师授课 4.班主任督学 5.真机实验 6.答疑解惑 7.学习评估 8.免费重听 9.推荐就业

  • 课程大纲
  • 学员评价(0)
一. 课程介绍
  •  华为大规模并行处理分布式数据仓库的原理介绍。
  •  数据库设计和优化,数据库开发,分布式数据仓库的管理。
  •  大数据挖掘理论。
  •  华为大数据挖掘服务平台 MLS 的学习。
二. 培训目标
  •  华为企业级的大型并行处理分布式数据仓库平台 FusionInsight LibrA 的架构、功能特性、数据库设计、数据库数据导入导出、数据库调优及数据库开发等技能。
  •  数据挖掘的理论(包括数据预处理、数据仓库、分类、聚类、关联规则等)。
  •  使用华为企业级大数据挖掘平台 FusionInsight Miner。
  •  基于华为云的企业智能平台 EI (Enterprise Intelligence)的基础服务 - MLS(Machine Learning Service,机器学习服务)进行数据深度分析和挖掘。
三. 课程体系
一、了解认识大数据组件
  • 大数据组件认识
1.大数据行业与技术趋势
2.HDFS 分布式文件系统技术
3.MapReduce 和 YARN 分布式计算引擎技术
4.Spark 基于内存的分布式计算技术
5.Kerberos&LDAP 技术及应用
6.HBase 分布式数据库
7.Hive 数据仓库工具
8.Loader 数据转换
9.Flume 海量日志聚合
10.Solr 数据搜索
11.Kafka 订阅消息系统
12.Oozie 工作流引擎
13.Zookeeper 集群分布式锁设施
14.Streaming 实时计算技术及应用
15.Hue 图形化管理
二、华为大数据平台搭建
  • FusionInsight 平台
16.FusionInsight 解决方案介绍
17.FusionInsight HD 集成设计
18.FusionInsight HD 安装部署
19.FusionInsight HD 产品维护
实验
实验:大数据业务管理实验
实验:大数据日常运维实验
三、大数据组件应用开发
  • Linux 基本操作
1.大数据整体
2.大数据开发流程
3.典型案例
4.Linux 安装,基本命令
6.Linux 文件系统&权限
  • HDFS 应用开发
1.HDFS 应用场景&业务过程
2.环境搭建&程序运行&常用接口
3. HDFS 组件应用实践
  • HBase 应用开发
1.HBase 应用场景&业务过程
2.环境搭建&程序运行
3.HBase 开发接口
4.表设计
5.HBase 组件应用实践
  • ​MapReduce 和 YARN 应用开发
1.MR 和 YARN 应用场景
2.MR 过程
3.环境搭建&程序运行
4.MR 开发接口
5.MR 组件应用实践
  • Hive 应用开发
1.Hive 应用场景&业务流程
2.环境搭建&程序运行
3.Hive 开发接口&组件应用实践
  • Solr 应用开发
1.Solr 应用场景&业务流程
2. 环境搭建&程序运行
3. Solr 开发接口&组件应用实践
  • Kafka 应用开发
1.Kafka 应用场景&业务流程
2.环境搭建&程序运行
3.Kafka 开发接口&组件应用实践
  • Spark 应用开发
1.Spark 应用场景&业务过程
2.环境搭建&程序运行
3.Spark 开发接口&组件应用实践
  • Redis 应用开发
1.Redis 应用场景&业务流程
2.环境搭建&程序运行
3.Redis 组件应用实践
  • Streaming
1.Streaming 应用场景&业务流程
2.环境搭建&程序运行
3.Streaming 组件应用实践
  • Flume 应用开发
1.Flume 应用场景&业务流程
2. 环境搭建&程序运行
3. Flume 组件应用实践
  • Oozie 应用开发
1.Oozie 应用场景&业务流程
2.环境搭建&程序运行
3. Oozie 组件应用实践
实验  上机实验
四、A FusionInsight LibrA  分布式数据库
  • 分布式数据库概述
1.数据库体系架构基本知识
2.MPP 特性介绍
3.业界产品说明
4.FusionInsight LibrA 逻辑架构&物理架构
5.FusionInsight LibrA 数据库对象
  • ​FusionInsight LibrA 特性和关键技术
1.架构和支持的操作系统
2.面向应用开发的基本功能
3.数据库安全
4.图形化工具
5.高级特性
6.Database Manager
7.Data Studio
  • 安全管理与并发控制
1.访问控制
2.用户管理
3.权限管理模型
4.对象权限
5.安全审计
6.配置负载均衡
7.事务与隔离级别
8.LibrA 锁机制介绍
  • 数据库性能监控
1.系统资源监控方式
2.性能相关视图
3.使用命令行监控集群性能
4.使用 DM 工具监控集群性能
  • 据迁移
1.数据迁移场景划分
2.GDS 工具适用场景和使用方法
3.copy from/to 适用场景和使用方法
4.开源 ELT 工具适用场景和使用方法
5.gs_dump/gs_restore 适用场景和使用方法
6.gsql 工具适用场景和使用方法
7.Roach 工具适用场景和使用方法
8.从其他数据库中迁移数据
  • SQL 介绍
1.SQL 相关机制和原理
2.利用 EXPLAIN 进行 SQL 调优
3.数据库设计&逻辑设计
4. 存储模式,数据分布,表分区,索引
  • 数据库设计
1.数据库逻辑设计
2.存储模式设计
3.数据分布设计
4.表分区设计
5.索引设计
  • 应用程序开发指导
1.FusionInsight LibrA 驱动介绍
2.ODBC 应用程序开发
3.JDBC 应用程序开发
4.基础开发规范
实验  上机实验
五、大数据挖掘理论与实践
  • 预备知识和数据介绍
1.什么是数据挖掘
2.数据和属性类型
3.数据的统计描述
  • 数据预处理
1.数据清理
2.数据集成
3.数据规约
4.数据变换
  • 数据仓库
1.OLAP 和 OLTP 概念
2.数据仓库和数据集市概念
3.多维数据模型
4.概念分层
5.ROLAP/MOLAP/HOLAP
6.方体物化
  • 分类
1.分类和回归的概念
2.决策树(ID3、C4.5 和 CART)
3.朴素贝叶斯分类
4.bootstrap
5.组合分类(装袋、提升、随机森林)
6.后向传播
7.支持向量机(SVM)
  • 聚类
1.聚类概念
2.k-均
3.k-中心点(PAM、CLARA、CLARANS)
  • 离群点
1.离群点概念
2.离群点检测方法
  • 关联规则
1.基本概念、购物篮分析
2.项集
3.频繁项集挖掘和 Apriori 算法
  • Miner 与 MLS
1.FusionInsight Miner 与 MLS 介绍
2.DEMO 演示
实验
实验一、银行定期存款业务预测
实验二、银行客户分群
实验三、CRM 用户精准营销
六、 HCIE- - LAB
HCIE-LAB
七、 HCIE- - 面试
HCIE-面试

在线咨询 ×

您好,请问有什么可以帮您?我们将竭诚提供最优质服务!