范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

storm分布式实时大数据处理框架

  1.什么是storm
  Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等,大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Storm更是流计算技术中的佼佼者和主流。
  按照storm作者的说法,Storm对于实时计算的意义类似于Hadoop对于批处理的意义。Hadoop提供了map、reduce原语,使我们的批处理程序变得简单和高效。同样,Storm也为实时计算提供了一些简单高效的原语,而且Storm的Trident是基于Storm原语更高级的抽象框架,类似于基于Hadoop的Pig框架,让开发更加便利和高效。2.storm应用场景
  推荐系统(实时推荐,根据下单或加入购物车推荐相关商品)、金融系统、预警系统、网站统计(实时销量、流量统计,如淘宝双11效果图)、交通路况实时系统等等。3.storm的一些特性
  1.适用场景广泛: storm可以实时处理消息和更新DB,对一个数据量进行持续的查询并返回客户端(持续计算),对一个耗资源的查询作实时并行化的处理(分布式方法调用,即DRPC),storm的这些基础API可以满足大量的场景。
  2. 可伸缩性高: Storm的可伸缩性可以让storm每秒可以处理的消息量达到很高。扩展一个实时计算任务,你所需要做的就是加机器并且提高这个计算任务的并行度 。Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。
  3. 保证无数据丢失: 实时系统必须保证所有的数据被成功的处理。 那些会丢失数据的系统的适用场景非常窄, 而storm保证每一条消息都会被处理, 这一点和S4相比有巨大的反差。
  4. 异常健壮: storm集群非常容易管理,轮流重启节点不影响应用。
  5. 容错性好:在消息处理过程中出现异常, storm会进行重试
  6. 语言无关性: Storm的topology和消息处理组件(Bolt)可以用任何语言来定义, 这一点使得任何人都可以使用storm.4.storm集群结构
  Nimbus 和Supervisors 之间所有的协调工作是通过 一个Zookeeper 集群。
  Nimbus进程和 Supervisors 进程是无法直接连接,并且是无状态的; 所有的状态维持在Zookeeper中或保存在本地磁盘上。
  意味着你可以 kill -9 Nimbus 或Supervisors 进程,而不需要做备份。
  这种设计导致storm集群具有令人难以置信的稳定性,并且无耦合。5.storm工作原理
  Nimbus 负责在集群分发的代码,topo只能在nimbus机器上提交,将任务分配给其他机器,和故障监测。
  Supervisor,监听分配给它的节点,根据Nimbus 的委派在必要时启动和关闭工作进程。 每个工作进程执行topology 的一个子集。一个运行中的topology 由很多运行在很多机器上的工作进程组成。
  在Storm中有对于流stream的抽象,流是一个不间断的无界的连续tuple,注意Storm在建模事件流时,把流中的事件抽象为tuple即元组
  Storm认为每个stream都有一个源,也就是原始元组的源头,叫做Spout(管口)
  处理stream内的tuple,抽象为Bolt,bolt可以消费任意数量的输入流,只要将流方向导向该bolt,同时它也可以发送新的流给其他bolt使用,这样一来,只要打开特定的spout再将spout中流出的tuple导向特定的bolt,bolt又对导入的流做处理后再导向其他bolt或者目的地。
  可以认为spout就是水龙头,并且每个水龙头里流出的水是不同的,我们想拿到哪种水就拧开哪个水龙头,然后使用管道将水龙头的水导向到一个水处理器(bolt),水处理器处理后再使用管道导向另一个处理器或者存入容器中。
  为了增大水处理效率,我们很自然就想到在同个水源处接上多个水龙头并使用多个水处理器,这样就可以提高效率。
  这是一张有向无环图,Storm将这个图抽象为Topology(拓扑),Topo就是storm的Job抽象概念,一个拓扑就是一个流转换图
  图中每个节点是一个spout或者bolt,每个spout或者bolt发送元组到下一级组件。
  而Spout到单个Bolt有6种流分组策略。6.Topology
  Storm将流中元素抽象为tuple,一个tuple就是一个值列表value list,list中的每个value可以是任意可序列化的类型。拓扑的每个节点都要说明它所发射出的元组的字段的name,其他节点只需要订阅该name就可以接收处理。7.storm相关概念
  Streams:消息流
  消息流是一个没有边界的tuple序列,而这些tuples会被以一种分布式的方式并行创建和处理。 每个tuple可以包含多列,字段类型可以是: integer, long, short, byte, string, double, float, boolean和byte array。 你还可以自定义类型 — 只要你实现对应的序列化器。
  Spouts:消息源
  Spouts是topology消息生产者。Spout从一个外部源(消息队列)读取数据向topology发出tuple。 消息源Spouts可以是可靠的也可以是不可靠的。一个可靠的消息源可以重新发射一个处理失败的tuple, 一个不可靠的消息源Spouts不会。
  Spout类的方法nextTuple不断发射tuple到topology,storm在检测到一个tuple被整个topology成功处理的时候调用ack, 否则调用fail。
  storm只对可靠的spout调用ack和fail。
  Bolts:消息处理者
  消息处理逻辑被封装在bolts里面,Bolts可以做很多事情: 过滤, 聚合, 查询数据库等。
  Bolts可以简单的做消息流的传递。复杂的消息流处理往往需要很多步骤, 从而也就需要经过很多Bolts。第一级Bolt的输出可以作为下一级Bolt的输入。而Spout不能有一级。
  Bolts的主要方法是execute(死循环)连续处理传入的tuple,成功处理完每一个tuple调用OutputCollector的ack方法,以通知storm这个tuple被处理完成了。当处理失败时,可以调fail方法通知Spout端可以重新发送该tuple。
  流程是: Bolts处理一个输入tuple, 然后调用ack通知storm自己已经处理过这个tuple了。storm提供了一个IBasicBolt会自动调用ack。
  Bolts使用OutputCollector来发射tuple到下一级Blot。

米家温湿监测电子表知冷暖懂干湿的高颜值好物前言小米在今年的米粉节上推出了一款米家温湿度监测电子表,说起温湿度表的设计可谓是皆不友好!对于温湿度表来说,现在很多家庭中都有配备,但很少人会去常看温湿度。大多人都是等到感到环境不旗捷推出适用于小米喷墨打印机系列通用芯片关于新品旗捷自主研发产品稳定安全服务专业高效新品型号适用于小米喷墨打印机系列通用芯片关于小米喷墨打印机(图片来自小米官网)2020年6月小米正式发布米家喷墨打印一体机,这是一台无线我睡过最满意的伴侣,南卡Zzzz骨传导蓝牙音箱,枕中宝陪睡体验你有睡前听音乐的习惯吗?怎么听?用什么听?第二天醒来感觉如何?我虽不能身临其境,想必其中一定有让人不快的地方吧。来看看这款南卡Zzzz骨传导蓝牙音箱,它也许能解决你的问题。产品来自这个比赛竟然如此有趣,现在的孩子想玩游戏就自己开发原子同学本次Scratch线上编程挑战赛已接近尾声,大赛历时近20天,吸引上百名学员参赛,经过裁判组公正评选及大众投票,最终评选结果新鲜出炉啦!评选结果公布及优秀作品展示大赛评选结果公布特猴子能用意念玩游戏了!你在开玩笑嘛?原子同学是的,你没有看错,猴子能用意念玩游戏了马斯克旗下脑机接口公司最近公布了一段名为帕格(Pager)的9岁猕猴玩乒乓球电子游戏的视频。帕格通过内置的Neuralink设备实现了用意念操四强!6766战队,我们的骄傲与荣耀!原子同学5月31日,2021RCC钱江国际机器人公开赛在杭州国际博览中心落下帷幕,ATOMXSKOLL6766战队与来自全国13个城市的48支战队经过3天的激烈角逐,最终以联盟队长的身份挺2020原子同学首届教师技能大赛师者匠心N1师者,当怀一颗匠心为更好展示教师风采,打造优质高效课堂,为教师们提供一个相互交流学习的平台,原子同学于2020年11月18日19日在总部圆满举办首届教师技能大赛。大赛评委团由原橱窗里的衣服很鲜艳?专业的设备,让你乖乖买单大家好,这里是灯圈儿,这里讲解LED灯饰照明。问朋友们两个问题1有没有觉得店铺里的衣服很好看,穿在身上却差强人意?2有没有觉得肉摊上的肉块色泽鲜艳,而买回家清洗时发现有点苍白?无论游戏超神好助手北通H1游戏手柄随着生活节奏加快,人们的时间也变得越来越碎片化,而陪伴在人们身边形影不离的手机,自然代替电脑成为人们娱乐的工具。这几年手游市场也越来越大,更多人开始使用手机开始打游戏,一个产业火起真战神归来JEETMARS蓝牙耳机体验目前无线耳机的类型主要无非就是头戴式颈挂式以及TWS。TWS是TrueWirelessStereo的缩写,这是也是目前无线耳机中最为轻便的一种蓝牙耳机,对于我自己来说非常喜欢这种蓝澎湃音质,皮革手感!夜空繁星JEETMARS真无线耳机上手序2019年的无线耳机耳机市场可谓是竞争的如火如荼,TWS是目前无线耳机主流的解决方案。最近博主收到了深圳泰捷科技的JEETMARS真无线蓝牙耳机。没错,还是我们的好朋友JEET,
与屏下摄像头带来的视效相当?iQOO官微再次暗示新机屏幕很有料不久前,iQOO官方正式公布,iQOO8系列新品发布会将会在8月17日1930正式开启,让许多用户非常期待。而更让人没有想到的是,iQOO8系列在确定发布会时间后,更是直接放出了猛手机影像能力达到电影工业级,荣耀Magic3又发一个领跑行业的大招伴随5G网速的加快,互联网从图片时代加速进入了短视频时代。用户对智能手机的视频拍摄以及制作能力也提出了更高的要求。时代趋势以及用户需求促使视频拍摄体验成为了手机厂商影像技术比拼的新国产版HomePod?网易三音云音箱的这个功能苹果HomePod都没有网易云音乐,起步要比QQ音乐酷狗虾米音乐晚,却是最能搞事的。2017年3月20日,由网易云音乐和杭港地铁联合推出的乐评专列看见音乐的力量,首发仪式在杭州地铁1号线江陵路站举行。50布丁迷你豆,可以制定课表计划的教育机器人由于家中有两个孩子的缘故,我对早教产品比较关注。从最初的插卡故事机,到可通过蓝牙WIFI播放的早教机,再到如今的AI智能机器人,早教产品使用上越来越便利。如今,早教类智能机器人的广邻居抢着来借的擦窗神器BOBOTWIN3030全自动擦窗机器人实战演示对于居住在城市里的现代人而言,高层住宅的大玻璃窗带来了良好的采光和广阔的视野,但同时玻璃窗的清洁难题也随之而来。当初买房的时候我们看中了房子窗户多采光好,又是高层还能看得见一些江景小米MAX3VS荣耀8XMAX,选系统还是选价格?对于喜欢超大屏的人来说,今天发布的荣耀8XMAX无疑是个不错的选择。荣耀8XMax和小米Max3配置有很多相同之处,都是采用高通骁龙636处理器,4G内存,1600W200W双摄像落地不到15万?这几款2。0T的优质SUV,性价比超乎想象在如今满大街汽车都是1。5L排量的环境下,2。0T车型悄然生息地成为了香饽饽,尤其是SUV车型。放眼过去,2。0的排量在国内很难激起大的波澜,如今却是大众的宠儿,真的是时过境迁,三二手车买几年车龄的性价比高?2年4年还是6年?很多人买错了近年来随着国内汽车市场的异常火爆,二手车市场热度也一直居高不下。很多朋友买二手车,其实也并非只图便宜,也有别作他用。不管出于什么目的,不可否认二手车的前景都十分巨大。不过长期以来二荣威艾瑞泽锐程宝骏和名爵,哪款国产家轿性价比高?受到疫情的影响,全球车企面临的芯片荒愈演愈烈,波及到的主机厂有的大面积停工停产,有的大幅削减产量,甚至还有因此关门大吉的。终端市场优惠越多的车企受到的影响越大,不仅优惠减少,而且还400元台湾厂商倒闭电竞椅为何瞬间售罄?竟和欧洲舒达用料同档今天和大家聊聊那把遗产电竞椅的故事,最主要的,也是跟大家表示一下惭愧的心情。当时跟大家介绍的是,不可以调节仰角,但实际确实是可以的,自然要发个文章说明一下,以免大家到手之后浪费了功339元东芝500G固态硬盘开箱!某夕夕黑卡瞬间被冻结锁5单最近某夕夕的黑卡福利频繁出现,瞬间满级的黑卡口令多多五年礼,让几乎所有支持黑卡的商品都可以立即减少50元。然后我们发现了各种网红爆款的东西出现649元的微星B460M迫击炮主板36