Huawei BigData HCNA

大数据工作内容

  1. 数据获取
  2. 数据存储
  3. 数据分析
  4. 数据挖掘

大数据的4V定义

  1. 巨量化
  2. 多样性
  3. 价值
  4. 速度

分布式

  1. 一个任务分成N个子任务运行。

RAID6

HDFS

===高容错 ===

硬件不可靠

支持大文件存储

  1. 与其它文件系统相比,最大的区别在于HDFS无数据的固定(150b),不管多大的文件都是150b,元数据平时加载在内存中运行,因此,当内存值固定。

作业

  1. 写出RAID级别的相关概念和对应的参数比较(创建充许的优劣,利用率)
  2. 写出EC中,N+M和N+M:B的原理
  3. 写出HDFS的特点不少于4个.
  4. 写出HDFS的读写流程