范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

大数据开发HDFS(HA)

  昨天结束了zookeeper的学习,今天就给大家带来"大数据开发-HDFS(HA)",大家不要感到奇怪,HDFS讲了那么多章怎么还没讲完,因为HDFS是大数据开发的一个重要知识点,含有很多的内容,也因此时间花费要多一些。下面就开始HDFS(HA)的学习。
  HDFS的高可用(HA)也被称之为联邦HDFS,因为单个namenode在HDFS集群中可能发生单节点故障,一旦节点不可用,那么整个HDFS集群就会处于不可用状态。Hadoop2.0之前,NameNode是单个集群的故障点,NameNode作为集群首脑,存放着集群中所有的元数据,一旦节点出错,将导致整个集群不可用。为了解决这个问题,HA(高可用)就被引入了。
  在一个典型的HDFS HA场景中,通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,比如处理来自客户端的RPC请求,而Standby NameNode则不对外提供服务,仅同步active namenode的状态,以便能够在它失败时快速进行切换。
  为了能够实时同步Active和Standby两个NameNode的元数据信息(实际上editlog),需提供一个共享存储系统,可以是NFS、QJM(Quorum Journal Manager)或者Bookeeper,Active Namenode将数据写入共享存储系统,而Standby监听该系统,一旦发现有新数据写入,则读取这些数据,并加载到自己内存中,以保证自己内存状态与Active NameNode保持基本一致,如此这般,在紧急情况下standby便可快速切为active namenode。
  一、Hadoop 系统架构
  1.1 Hadoop1.x和Hadoop2.x 架构
  在介绍HA之前,我们先来看下Hadoop的系统架构,这对于理解HA是至关重要的,Hadoop
  1. x之前,其官方架构如图1所示:
  从图中可看出,1.x版本之前只有一个Namenode,所有元数据由惟一的Namenode负责管理,可想而之当这个NameNode挂掉时整个集群基本也就不可用。
  Hadoop 2.x的架构与1.x有什么区别呢。我们来看下2.x的架构:
  2.x版本中,HDFS架构解决了单点故障问题,即引入双NameNode架构,同时借助共享存储系统来进行元数据的同步,共享存储系统类型一般有几类,如:Shared、NAS+NFS、BookKeeper、BackupNode 和 Quorum Journal Manager(QJM),上图中用的是QJM作为共享存储组件,通过搭建奇数结点的JournalNode实现主备NameNode元数据操作信息同步。
  二、HA中的角色如下
  1.ZKFC
  ZKFC即ZKFailoverController,作为独立进程存在,负责控制NameNode的主备切换,ZKFC会监测NameNode的健康状况,当发现Active NameNode出现异常时会通过Zookeeper集群进行一次主备选举,完成Active和Standby状态的切换;
  2.HealthMonitor
  定时调用NameNode的HAServiceProtocol RPC接口(monitorHealth和getServiceStatus),监控NameNode的健康状态并向ZKFC反馈;
  3.ActiveStandbyElector
  接收ZKFC的选举请求,通过Zookeeper自动完成主备选举,选举完成后回调ZKFC的主备切换方法对NameNode进行Active和Standby状态的切换;
  4.JouranlNode集群
  共享存储系统,负责存储HDFS的元数据,Active NameNode(写入)和Standby NameNode(读取)通过共享存储系统实现元数据同步,在主备切换过程中,新的Active NameNode必须确保元数据同步完成才能对外提供服务。
  三、为什么要Namenode HA?
  Hadoop0.23.2版本之前, NameNode是HDFS集群的单点故障点,每一个集群只有一个NameNode,如果这个机器或进程不可用,整个集群就无法使用,直到重启NameNode或者新启动一个NameNode节点。影响HDFS集群不可用主要包括以下两种情况:
  1)第一种情况是如机器宕机这样的意外情况,将导致集群不可用,只有在重启NameNode之后才可使用。
  2)第二种情况是计划内的软件或硬件升级(NameNode节点),将导致集群在短时间范围内不可用。
  四、Namenode HA 实现
  1.数据同步问题
  如何保持主和备NameNode的状态同步,并让Standby在Active挂掉后迅速提供服务,namenode启动比较耗时,包括加载fsimage和editlog(获取file to block信息),处理所有datanode第一次blockreport(获取block to datanode信息),保持NN的状态同步,需要这两部分信息同步。
  2.防止脑裂
  指在一个高可用(HA)系统中,当联系着的两个节点断开联系时,本来为一个整体的系统,分裂为两个独立节点,这时两个节点开始争抢共享资源,结果会导致系统混乱,数据损坏。
  3.NameNode切换对外透明
  主Namenode切换到另外一台机器时,不应该导致正在连接的客户端失败,主要包括Cliet,Datanode与NameNode的链接。
  以上就是本期的所有内容了,HDFS作为大数据开发的一个重难点,需要许多的知识点需要学习,花费的时间也会更多,希望大家认真的将这一个知识点学完。
  希望大家点个关注,及时收取最新文章推送,想了解更多敬请咨询加米谷大数据。
  有问题的欢迎在评论区留言,如有侵权请告知。

洗澡听歌两不误,TAOTRONICS吸盘式蓝牙音箱你洗澡是否喜欢听下音乐?一天忙碌下来,也要找个时间给自己放松一下吧!洗澡本身就是休闲放松的时刻,这个时候整个人会处在放松下来的状态,所以这个时候听音乐能够让自己更加的放松,如此有助Vidda发布品牌升级战略做年轻人的第一台好电视来源半岛都市报半岛网8月26日,海信旗下年轻化子品牌Vidda举行品牌升级暨音乐电视发布会。发布会上,Vidda首席品牌官朱书琴揭晓了全新升级的品牌形象,并公布了全新的一二三品牌战马斯克特斯拉FSDBeta10应该在下周五更新IT之家8月26日消息特斯拉在8月16日发布了自动驾驶系统测试版FSDBeta9。2版本,但马斯克(ElonMusk)认为最新发布的版本不够好,AutopilotAI团队正尽快改进小米12暂定12月发布,4nm工艺处理器,或将支持屏下摄像技术小米12爆料了也相当长的一段时间了,不过也都只是一些第三方媒体的爆料,相关消息的真实性还都有待考究。近期又有数码大V爆料了关于小米12系列的相关消息,而且还有最新的外观设计图,综合印度想吸引特斯拉建厂,承诺比中国成本低,马斯克先把关税降了特斯拉准备在今年开始进入印度市场,在印度销售特斯拉电动车。为了让自己的电动车能够打开印度市场,特斯拉一直在游说印度政府下调电动车的进口关税。特斯拉的目标是把印度电动车的进口关税下调人工智能助力传统中医祉云科技开启中医数字时代互联网云计算人工智能等新一代信息技术正推动中医药行业创新发展。国务院2019年发布的关于促进中医药传承创新发展的意见提出,实施互联网中医药健康服务行动,建立以中医电子病历电子处方等拉高视觉上限,MiniLED技术前景一片大好当下的大屏市场技术格局已经非常明晰,它们分别是以自发光为优势的OLED阵营。和以稳定物美价廉为优势的LCD方面军。而我们都知道,液晶技术历经数十年沉淀,是一种非常成熟的显示技术,但涨知识了,互联网上门回收旧衣服,值得更新换代最近,家里面整理出来了好多旧衣服废纸等废品,本来想着扔掉,后面脑子里面冒出来收废品的样子,于是想着在小程序上能不能搜到回收的。输入回收两个字,跳出来很多互联网回收平台,在手机上下单中国移动权威认证小米包揽前二,华为全面消失,小米时代来了?近日,中国移动发布了第四期通信5G指数报告,可以看到,国内智能手机市场的格局也发生了非常大的改变。记得在中国移动发布第二期的通信5G指数报告的时候,华为还是最强王者,包揽了前十四名中国移动公布2021年智能硬件质量报告,天玑12005G性能获满分近日,中国移动发布了2021年智能硬件质量报告,其中5G芯片评测部分广受关注。中国移动在SA网络模式下,对骁龙888天玑1200三星Exynos1080三大商用芯片的数据上传下载性中国电信庆祝上市免费送千兆宽带却被嘲送不起别送CNMO新闻8月25日,CNMO在中国电信营业厅官方发现,为了庆祝中国电信在上交所主板成功发行上市,决定向广大中国电信老客户发起了一个超大的福利活动。中国电信官方的消息显示,10年
运营商自研5G手机,最佳辅助联发科有何大招?数字化浪潮滚滚而来,在新技术需求和全球供应链的不确定性交织下,ICT产业将迎来新的增长周期,而5G将带动芯片终端设备等全产业链实现规模增长。据中国信息通信研究院总工程师胡坚波预测,荣耀Magic3系列旗舰手机新品发布会平板手机手表齐上阵荣耀将于今晚1930举办Magic3系列旗舰手机新品发布会。在今日发布的预热海报上,官方表示荣耀平板V7Pro荣耀手表GS3荣耀X20将同时发布。荣耀X20将采用双挖孔窄边框LCDPython终结者生成器(Generator)和Yield,据说学会能加薪1000来源麦叔编程作者麦2叔先来学几个英文单词,本文统一使用英文单词表示以下概念Iterable可迭代对象Iterator迭代器Generator生成器本文的重点是Generator,之三星5G概念新机,Exynos2200处理器加持,是一款三星5G旗舰机皇自进入2021年后,5G网络已经被全面普及,很多人对5G都有了一个比较清晰的概念,那就是速度比4G快了数倍,随着各大手机厂商不断地发布5G手机,手机行业的发展在更加迅猛的同时竞争也小鹏P7体验评测什么才是智能化座舱?如今,无论是新能源汽车还是传统燃油汽车,都在向着一个方向努力,那就是智能座舱。不过,对于这方面来说,新能源汽车尤其是纯电动汽车,相对在能源方面给予了智能化的一个先天优势,也就是能够屏下摄像头4999元起,小米MIX4,这次值得买么?MIX作为小米最前沿的科技系列,从初代开始便将全面屏推向手机市场的潮流顶端,往后推出的手机更是采用不同方案,以带来一块完整的屏幕,但四年前发布的MIX3却成为了这个系列的最后一款手晶莹剔透iPhone12Pro镜头下的小米MIX48月10日晚,在2021雷军年度演讲上,小米正式发布MIX4手机。中关村在线编辑小刚在体验过后第一时间通过手中的iPhone12Pro带来图赏。此次小米MIX4采用CUP全面屏方案带摄像头边看边冲素诺智能可视冲牙器C3Pro评测评测前言天极网家电老谢冲牙器是清洁口腔的工具,用高压水流冲击来清洁牙龈牙缝的食物残渣,预防口腔疾病。口腔深处的后臼齿牙缝等地方,牙刷牙线难以抵达,冲牙器的水流则可以轻松抵达,清洁干来客推微信小程序开发制作流程简单4步搞清楚丨小程序开发很多想做小程序的商家一看到开发制作,就望而生畏,认为制作小程序是一个复杂的流程,也会担心自身没有专业人士配合,没办法很好地保证小程序正常上线。其实,这种担心是多虑的。现在,市面上大科技犬一文看懂内折外翻卷曲,七款折叠屏手机到底咋选科技犬一文看懂内折外翻卷曲,七款折叠屏手机到底咋选内折叠屏手机华为MateX2华为正式发布新一代折叠屏手机MateX2,搭载麒麟9000芯片,其256GB版售价17999元,512南卡NANKPOW3充电宝,无线磁吸黑科技手机作为我们生活中必不可少的东西,谈到它必不可少的配件就是充电宝,虽说很多场合都设置了共享充电宝,但仍然有很多覆盖不到的地区,加上考虑到经济问题,还是自己携带一个更加方便,但是普通