范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Spark(六)RDD的血缘依赖

  RDD依赖关系1. RDD血缘关系
  RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(血统)记录下来,以便 恢复丢失的分区 。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数据丢失时,它可以根据这些信息来重新运算和恢复丢失的数据分区。
  查看RDD的血缘方法: rdd.toDebugString
  示例 /**  * @description: RDD血缘依赖  * @author: HaoWu  * @create: 2020年08月04日  */ object DependeciedTest {   def main(args: Array[String]): Unit = {     val conf = new SparkConf().setAppName("RDDTest").setMaster("local[*]")     val sc = new SparkContext(conf)     val rdd1 = sc.makeRDD(List(1, 2, 3, 4)).map(x => x)     println(rdd1.toDebugString)     println("----------------------")     val rdd2 = rdd1.map(x=>x)     println(rdd2.toDebugString)     println("----------------------")     val rdd3 = rdd2.groupBy(x=>x)     println(rdd3.toDebugString)     println("----------------------")     rdd3.collect()   } }
  结果 (8) MapPartitionsRDD[1] at map at DependeciedTest.scala:15 []  |  ParallelCollectionRDD[0] at makeRDD at DependeciedTest.scala:15 [] ---------------------- (8) MapPartitionsRDD[2] at map at DependeciedTest.scala:18 []  |  MapPartitionsRDD[1] at map at DependeciedTest.scala:15 []  |  ParallelCollectionRDD[0] at makeRDD at DependeciedTest.scala:15 [] ---------------------- (8) ShuffledRDD[4] at groupBy at DependeciedTest.scala:21 []  +-(8) MapPartitionsRDD[3] at groupBy at DependeciedTest.scala:21 []     |  MapPartitionsRDD[2] at map at DependeciedTest.scala:18 []     |  MapPartitionsRDD[1] at map at DependeciedTest.scala:15 []     |  ParallelCollectionRDD[0] at makeRDD at DependeciedTest.scala:15 [] ---------------------- 2. 依赖关系
  依赖关系: 当前RDD和和父RDD之间的依赖关系
  查看依赖关系方法: rdd.dependencies
  示例 /**  * @description: RDD依赖关系  * @author: HaoWu  * @create: 2020年08月04日  */ object DependeciedTest {   def main(args: Array[String]): Unit = {     val conf = new SparkConf().setAppName("RDDTest").setMaster("local[*]")     val sc = new SparkContext(conf)     val rdd1 = sc.makeRDD(List(1, 2, 3, 4))     println(rdd1.dependencies)     println("----------------------")     val rdd2 = rdd1.map(x=>x)     println(rdd2.dependencies)     println("----------------------")     val rdd3 = rdd2.groupBy(x=>x)     println(rdd3.dependencies)     println("----------------------")     rdd3.collect()   } }
  结果 //不依赖于任何RDD List() ---------------------- // 1对1(1父1子)依赖  (窄依赖),窄依赖不会划分Stage List(org.apache.spark.OneToOneDependency@1eaf1e62) ---------------------- //1对N(1父多子)依赖(宽依赖或shuffle依赖),宽依赖会划分Stage List(org.apache.spark.ShuffleDependency@5fad41be) ---------------------- 3. RDD的宽窄依赖窄依赖  (NarrowDependency) 每一个父RDD的Partition只能被子RDD的一个Partition使用,窄依赖我们形象的比喻为独生子女。 宽依赖  (ShuffleDependency) 同一个父RDD的Partition被多个子RDD的Partition依赖,会引起Shuffle,宽依赖我们形象的比喻为多生。 4.任务划分
  RDD任务切分中间分为:Application、Job、Stage和Task Application:初始化一个SparkContext即生成一个Application; Job:一个Action算子就会生成一个Job; Stage:Stage等于宽依赖(ShuffleDependency)的个数加1; Task:一个Stage阶段中,最后一个RDD的分区个数就是Task的个数。
  注意 :Application->Job->Stage->Task每一层都是1对n的关系。

2022年04月14日星期四互联网日报1。工信部将支持符合条件的工业互联网企业首次公开发行证券并上市2。交通运输部加强道路客运电子客票信息安全管理,严防旅客个人信息等重要数据泄露3。上海市监局发布疫情防控期间电商经营活Meta要从元宇宙中抽取47。5的佣金,苹果发言人斥其虚伪记者司林威元宇宙还未进入现实,但关于手续费的争议已经开始。4月15日,针对Meta公司计划对在该公司旗下元宇宙内购买的数字资产收取47。5的佣金计划,苹果公司发言人弗雷德塞恩斯在一受气候变化影响,有哪些原本无法见面的猛兽,未来可能会掐架?在近几十年时间里面,全球气候变暖是一个被人们反复提起的话题,也是一个老生常谈的话题,随着全球气温升高所带来的现象逐渐明显,这一问题也得到了人们越来越多的关注。全球气候变暖是一种和自威马E。5下月上市,和M7共同入局轿车市场威马E。5下月上市,和M7共同入局轿车市场作者麻辣车事不难发现,继EX5之后,威马近年来的产品规划一直都在致力于往中端市场进军。尤其是即将推出的M7,似乎是希望可以抢占部分特斯拉M恐龙毁灭时有多痛苦?2公里厚的岩层告诉你,这种痛苦难以形容在我们生存的这个星球上,曾经诞生过很多物种和文明,人类算是至今进化最晚的文明社会主宰者。大约在2。4亿年前,称霸地球是乃是恐龙,他们支配了地球长达1。6亿年。相较于恐龙对地球的支配美国中央情报局长美国关注的是中国,而不是中国人!有意思啊,美国中央情报局长伯恩斯表示,美国关注的是中国,而不是中国人。美国走向衰退不是没有道理的,连话都不会说,不会讲话的人来管理国家,来要管理全球事物,这是天下最滑稽的事了。伯恩华东理工重构共价有机框架材料近日,国际权威学术期刊自然在线报道了华东理工大学化学与分子工程学院朱为宏教授田禾院士等基于动态化学构筑共价有机框架材料研究取得的突破性进展。这是华东理工大学首次以第一通讯单位在自然App隐私政策看完要半小时,你看了吗?大洋网讯上万字的隐私政策,看完要半小时,你看了吗?近日,江苏省消保委进行的一次调查显示,App的隐私政策冗长大片字体加粗难以起到显著提示的作用。广州日报全媒体记者调查也发现,App海尔与中国移动合作海尔与中国移动合作,在山东省青岛市利用5G技术实现了精密工业装备的现场辅助装配场景的应用。青岛海尔家电工厂结合海尔卡奥斯工业互联网平台,打造基于5GMEC的互联工厂,开展了基于AR折叠屏手机市场增长快2022年国内市场或将迎来新一轮爆发继OPPOFindN和荣耀MagicV之后,4月11日晚,vivo发布首款折叠屏手机XFold。至此,国内主流手机厂商基本入局折叠屏赛道。2021年被称为折叠屏元年。市场调研机构O自动驾驶,李彦宏的挣扎与不甘2017年的那个夏天,在百度AI开发者大会的连线直播上,李彦宏坐着一辆无人驾驶的汽车上了五环,然后吃到了一张罚单。他不仅不郁闷,反倒很高兴。事后在谈及这个罚单时,他高喊着无人驾驶罚
辞旧迎新,祝大家2019年元旦节快乐!弹指一挥间,2018年已接近尾声,2019年元旦如约而至。在这辞旧迎新之际,趁此机会感谢,感谢大家对翼联EDUP的关注和支持!难忘的2018年即将远逝,回顾2018年企业的点点滴滴4G随身WiFi,有信号就有网!随着经济的高速发展,人们待在家里的时间也越来越少了,对于个人来说拉宽带也从必须拉宽带到可拉可不拉!但是每天晚上回家还是必须要上网的,怎么办呢?今天在这里给大家介绍一款实惠又好用的4我国江苏发现2亿多年前的生物,世上真的有不老的生物吗?世界上存在长生不老的生物或者方法吗?从秦始皇到现在,很多人都在追寻这个问题的答案,然而遗憾的是,都没有人能寻找到不老方法。女巫的仙药但是,最近网上热传的这个物种可能打破了世人的眼界吴亦凡终被批准逮捕,当初声称一切都是污蔑的后援会现在怎样了?加拿大明星吴亦凡涉嫌强奸,终于被检察院批准逮捕了。应了那句老话法网恢恢,疏而不漏!这是继加拿大人员在我国贩毒案后,又一名加拿大人在我国犯罪,并引起轰动的。吴亦凡被捕从我国法律流程上美国龙飞船和俄罗斯联盟号飞船对比,你愿意乘坐哪家的?这下该俄罗斯宇航员高兴,美国宇航员要哭了。有消息称俄罗斯联邦航天局和NASA(美国国家航空航天局)接近达成协议,让部分俄罗斯宇航员乘坐龙飞船前往空间站,作为交换,部分NASA宇航员向印度学习?美国火箭发射时水平漂移,摄影师差点找不到火箭美国火箭发射再遭失败,火箭点火后竟水平横向漂移。北京时间8月29日,美国阿斯特拉公司(Astra)发射了一枚火箭3。3版本LV0006号,与以往点火后火箭直直起飞不同,这次火箭点火不愧为狂人,马斯克居然用2手飞船3手火箭将4名平民送进了太空普通人和太空有多远?很多人可能觉得很遥远,甚至觉得航天与平民无关,但钢铁侠告诉你,答案是0!Inspiration4发射前6分钟就在刚刚,Spacex进行了一次全球瞩目的载人航天发星链互联网无法监管怎么办?马斯克狂言他们可以对天挥舞拳头大家都知道,目前世界上最大的太空互联网网络是Spacex的星链(stralink),迄今已经向太空发射了超过1700颗互联网卫星。这些星链卫星几乎遍布全球,目前已经有十多个国家允许马斯克本月要将4名平民送入太空,没有宇航员陪同,其中3人免费9月份全球最值得期待的航天发射来了,4人宇宙旅游纯玩团(Inspiration4)!这是Spacex公司推出的太空纯旅游项目,使用二手龙飞船坚韧号搭载4名普通公民上天,进行34天的直径1。4公里的小行星,撞击地球相当于多少颗核弹释放的能量?1。4公里的小行星如果撞上地球,会发生什么事情?大约在6500千年前,一颗直径9。6公里的小行星撞上了地球,当时统治地球的恐龙因此灭绝了。小行星撞击地球动画今天这颗要来拜访地球的小苹果iphone13可以直接连接卫星网络,国内手机会跟进吗?前不久,知名分析师称苹果最新手机iphone13支持和卫星直接连接,也就是说不需要经过地面基站,就可以直接连接网络,引起网络热议!iphone13直连卫星的传言目前,这个消息被越来