Differences between revisions 15 and 16
Revision 15 as of 2018-06-02 09:06:55
Size: 1024
Editor: localhost
Comment:
Revision 16 as of 2018-06-10 08:35:02
Size: 1025
Editor: merlyn
Comment:
Deletions are marked like this. Additions are marked like this.
Line 24: Line 24:
===高容错 === === 高容错 ===

Huawei BigData HCNA

大数据工作内容

  1. 数据获取
  2. 数据存储
  3. 数据分析
  4. 数据挖掘

大数据的4V定义

  1. 巨量化
  2. 多样性
  3. 价值
  4. 速度

分布式

  1. 一个任务分成N个子任务运行。

RAID6

  • 采用两块校验盘进行数据保护,一块横向盘,一块横向盘。横向盘用于数据保护,斜向盘保护横向盘和数据。

HDFS

  • 基于Google GFS论文开发

高容错

硬件不可靠

支持大文件存储

  1. 与其它文件系统相比,最大的区别在于HDFS无数据的固定(150b),不管多大的文件都是150b,元数据平时加载在内存中运行,因此,当内存值固定。

作业

  1. 写出RAID级别的相关概念和对应的参数比较(创建充许的优劣,利用率)
  2. 写出EC中,N+M和N+M:B的原理
  3. 写出HDFS的特点不少于4个.
  4. 写出HDFS的读写流程

首頁/2018-06-02 (last edited 2018-06-10 08:40:03 by localhost)