Differences between revisions 5 and 6

Spark VS Mapreduce

Spark

用户向Client提交应用，Client接收
Client向RM提交请求，申请应用，RM中的APPMANAGER会返回一个JOB-ID
CLIENT下发应用，通过对应用到进行解析，我们可以提取并且加载DRIVER，DRIVER一般是运行在CONTAINER中的，和MR中的APPMASTER一样，当然用户亦可指定DRIVER的执行位置
DRIVER启动之后，会联系APPMANAGER，下发APPMASTER程序，APPMANAGER收到请求之后，会向ResourceManager查询当前集群中节点的负载情况，选择其中负载最小值的VM,然后要求其拉起Container，并且将APPMASTER下发到其中运行。
APPMASTER启动之后，无需注册，直接计划当前的应用需要消耗的资源，DRIVER会根据应用的执行情况，将应用切分为Aplication(个数为1)

-  ⇤ ← Revision 5 as of 2018-06-09 04:07:46 → 
  Size: 1174
  Editor: localhost
  Comment:
+   ← Revision 6 as of 2018-06-09 06:25:36 → ⇥
  Size: 1270
  Editor: localhost
  Comment:
-Deletions are marked like this.
+Additions are marked like this.
 Line 22:
+== DataSet ==
  I. 以行为单位的数据
== DataFrame ==
  I. 以列为单位的数据