Differences between revisions 6 and 16 (spanning 10 versions)
Revision 6 as of 2018-06-02 01:46:54
Size: 164
Editor: localhost
Comment:
Revision 16 as of 2018-06-10 08:35:02
Size: 1025
Editor: merlyn
Comment:
Deletions are marked like this. Additions are marked like this.
Line 9: Line 9:

== 大数据的4V定义 ==
  I. 巨量化
  I. 多样性
  I. 价值
  I. 速度

== 分布式 ==
  I. 一个任务分成N个子任务运行。

== RAID6 ==
  * 采用两块校验盘进行数据保护,一块横向盘,一块横向盘。横向盘用于数据保护,斜向盘保护横向盘和数据。

== HDFS ==
  * 基于Google GFS论文开发
=== 高容错 ===
=== 硬件不可靠 ===
=== 支持大文件存储 ===
  I. 与其它文件系统相比,最大的区别在于HDFS无数据的固定(150b),不管多大的文件都是150b,元数据平时加载在内存中运行,因此,当内存值固定。


= 作业 =
  I. 写出RAID级别的相关概念和对应的参数比较(创建充许的优劣,利用率)
  I. 写出EC中,N+M和N+M:B的原理
  I. 写出HDFS的特点不少于4个.
  I. 写出HDFS的读写流程

Huawei BigData HCNA

大数据工作内容

  1. 数据获取
  2. 数据存储
  3. 数据分析
  4. 数据挖掘

大数据的4V定义

  1. 巨量化
  2. 多样性
  3. 价值
  4. 速度

分布式

  1. 一个任务分成N个子任务运行。

RAID6

  • 采用两块校验盘进行数据保护,一块横向盘,一块横向盘。横向盘用于数据保护,斜向盘保护横向盘和数据。

HDFS

  • 基于Google GFS论文开发

高容错

硬件不可靠

支持大文件存储

  1. 与其它文件系统相比,最大的区别在于HDFS无数据的固定(150b),不管多大的文件都是150b,元数据平时加载在内存中运行,因此,当内存值固定。

作业

  1. 写出RAID级别的相关概念和对应的参数比较(创建充许的优劣,利用率)
  2. 写出EC中,N+M和N+M:B的原理
  3. 写出HDFS的特点不少于4个.
  4. 写出HDFS的读写流程

首頁/2018-06-02 (last edited 2018-06-10 08:40:03 by localhost)