博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MapReduce1.x与MapReduce2.x差异
阅读量:5969 次
发布时间:2019-06-19

本文共 1063 字,大约阅读时间需要 3 分钟。

一.MapReduce1.x简介

  1.图解

    

  2.JobTracker

    主节点,单点,负责调度所有的作用和监控整个集群的资源负载。

  3.TaskTracker

    从节点,自身节点资源管理和JobTracker进行心跳联系,汇报资源和获取task。

  4.Client

    以作业为单位,规划作业计算分布,提交作业资源到HDFS,最终提交作业到JobTracker。

二.MapReduce1.x的弊端

  1.JobTracker负载过重,存在单点故障。

  2.资源管理和计算调度强耦合,其它计算框架难以复用其资源管理。

  3.不同框架对资源不能全局管理。

三.Hadoop2.x简介【基于YARN

  1.图解

    

  2.ResourceManager

    主节点,负责整个集群的资源管理。

  3.NodeManager

    与ResourceManager汇报资源,管理Container生命周期,计算框架中的角色都以Container表示。

  4.Container

    默认NodeManager启动线程监控Container大小,超出申请资源额度会kill掉。支持Linux内核的Cgroup。

  5.Client

    ResourceManager-client:请求资源创建ApplicationMaster-client。

    ApplicationMaster-client:与ApplicationMaster交互。

四.YARN

  YARN【Yet Another Resource Negotiator】:Hadoop 2.0新引入的资源管理系统,直接从MRv1演化而来的。

  核心思想:将MRv1中JobTracker的资源管理和任务调度两个功能分开,分别由ResourceManager和ApplicationMaster进程实现:

    1.ResourceManager:负责整个集群的资源管理和调度。

    2.ApplicationMaster:负责应用程序相关的事务,比如任务调度、任务监控和容错等。

  YARN的引入,使得多个计算框架可运行在一个集群中 每个应用程序对应一个ApplicationMaster 目前多个计算框架可以运行在YARN上,比如MapReduce、Spark、Storm等。

转载于:https://www.cnblogs.com/yszd/p/10885222.html

你可能感兴趣的文章
生产环境MySQL 5.5.x单机多实例配置实践
查看>>
Web应用工作原理、动态网页技术
查看>>
EXCEL工作表保护密码破解 宏撤销保护图文教程
查看>>
Catalan数(卡特兰数)
查看>>
Linux shell的条件判断、循环语句及实例
查看>>
JPA常用注解
查看>>
简单的设置
查看>>
常用命令1
查看>>
Windows Server 2012 DHCP故障转移
查看>>
Linux服务器配置和管理:虚拟机安装CentOS6.7
查看>>
掌握ajax
查看>>
ASA下邮件发送经常失败
查看>>
python3第八天(面向对象)
查看>>
我的友情链接
查看>>
ubuntu atp&dpkg
查看>>
主要 次要通道
查看>>
利用贝叶斯分类器进行文本挖掘---笔记
查看>>
我的友情链接
查看>>
将ping命令结果输出到文本
查看>>
小蚂蚁学习mysql性能优化(8)--数据库结构优化--范式化和反范式化,水平分表,垂直分表...
查看>>