设为首页 加入收藏

TOP

Hadoop之MapReduce执行原理
2017-08-06 10:23:16 】 浏览:2604
Tags:Hadoop MapReduce 执行 原理

Hadoop之MapReduce执行原理。面我画了一张图,便于理解MapReduce得整个工作原理

这里写图片描述Python、C++进程启动命令均可)以及该命令执行所需的环境变量和外部资源(比如词典文件、可执行文件、jar包等)。
另外,一个应用程序所需的Container分为两大类,如下:
(1) 运行ApplicationMaster的Container:这是由ResourceManager(向内部的资源调度器)申请和启动的,用户提交应用程序时,可指定唯一的ApplicationMaster所需的资源;
(2) 运行各类任务的Container:这是由ApplicationMaster向ResourceManager申请的,并由ApplicationMaster与NodeManager通信以启动之。
以上两类Container可能在任意节点上,它们的位置通常而言是随机的,即ApplicationMaster可能与它管理的任务运行在一个节点上。

整个MapReduce的过程大致分为 Map–>Shuffle(排序)–>Combine(组合)–>Reduce

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇C++ string相关函数 下一篇c++调用python+tensorflow模型(..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目