范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

大数据实时(7)如何构建Flink实时平台

  目录:
  1、场景痛点
  2、实时平台建设方案
  3、FlinkSQL开发平台
  4、展望
  1、场景痛点
  对于一个实时要求很高的业务领域,实时是非常重要的。分析下来场景问题差别不大,比如之前某一款产品解决的实时场景包括实时数仓 、加速查询、联邦查询。今天说的场景也大同小异,包括以下几个方面:
  1)实时数仓:针对行业日志,进行数据处理并提供高可用的即席查询服务,同时针对离线数仓,进行实效性的补充,提供更加实时的分析服务;
  3)实时监控:实时开始最核心的场景就是监控,后来才应用于业务相关的实时处理,所以监控的场景一直存在,一直演进;
  4)实时分析:要发挥数据的价值,要提供有价值的分析结果,支撑业务的决策、改进、优化,收获实际的业务价值;
  5)广告推荐:针对客户进行分类,然后针对不同客户制定不同的策略,推荐不同的结果,提升业务转化价值;
  6)特征工程:提取提炼特征,尝试通过算法进行实际的业务赋能;
  针对不同场景,核心的问题或痛点也是类似的,包括以下几个方面:
  1)更高的时效性:实时有时是客户能否用起来的关键,一个需要实时查看的数据如果不能实时,产品的价值折半,失去使用的价值都有可能;
  2)更稳的可用性:如何针对集群进行管理、进行资源隔离、指定任务的优先级及独立资源等等;
  3)更好的性能:针对不同的业务资源隔离、对于计算或查询型IO隔离等;
  4)更低的成本:随着任务、集群规模、计算量、峰值的不断增长,合理的进行成本规划和预算;6000+任务、几千万的成本、查询引擎高并发负载等;
  2、实时平台建设方案
  实时平台的核心场景包括3个部分,实时数据采集存储、实时数据计算、实时数据分发。采集存储是如何快速有效的将业务及行业数据采集到数据平台中;实时数据计算是将采集过来的数据如何准确有效的进行建模、计算、并生成最终的实时结果数据;实时数据分析是如何将结果数据快速地输出到使用方,包括输出给实时业务方或同步存储到实时DB中,并提供统一数据服务。
  说到平台,大家的理解可能不一样。这里说的是基于上述3个实时核心技术场景,提供技术支撑的技术平台,具体包括为数据处理过程提供基础设施平台、数据开发平台、运维平台、监控平台、质量平台。
  基础设施平台:主要是包括各种组件集群的构建,包括Kafka、Spartstreaming、Flink、Clickhouse、Doris等集群;
  运维平台:负责元数据管理和时间戳管理;
  监控平台:负责监控和预警,监控又可以分为进程、日志、延迟、状态等类型的监控;告警则根据规则进行不同等级的告警提醒,及送推送通知并通过看板展示相关监控结果信息;
  质量平台:重点是针对数据准确性,进行质量的巡检,并按照巡检结果依据质量处理机制及时处理准确性的问题,确保数据质量,更好的为业务服务和赋能;
  数据开发平台:最核心的内容,主要是Flink一体化计算平台,整个实时平台的核心,以Flink为基础,构建整体计算平台。另外一个比较重要的是数据采集分发平台,不管是数据的采集还是输出同步,都需要通过数据分发平台进行整合、管理、执行、运营。只有这样,才可能将数据汇集,然后提供数据价值服务,数据的核心价值所在。数据如果是静静地躺在电脑中,是没有任何意义的,需要流动起来,用起来才是真正有价值的。
  对于Flink一体化计算平台技术架构,大致包括数据接入(业务数据和行业日志)、计算引擎、实时存储、基础管理平台几个部分。对于数据接入,采取Canal进行业务数据采集,利用Canal的高可用方案,提升业务数据实时接入的完整性和准确性,并提供初始化、监控、重启、恢复等高可用方案;采取Flume进行行为日志的采集,也可以直接将行为日志上报到消息中间件中,确保行为日志数据的完整和准确,通过各种措施,保证行业日志的丢失率小于1%。计算引擎则是紧跟时代潮流,从Sparkstreaming到Flink,保证了实时计算引擎的领先性。实时存储的选择则非常多样,针对不同的场景提供不同的存储,以适应不同的需求,包括Kafka、Hbase、Es、ClickHouse,也研究过ADB、DWS等去上产品。基础管理平台则是对于整体平台、基础设施及运行时的状态提供必要的管理、监控、预警,保证高可用要求。
  其实计算平台各个厂都大同小异,各个组件也比较成熟,核心是要基于业务场景,做到比较好的匹配,以保证业务的顺利开展。背后的诉求主要就是3点,实时性、准确性、可用性要达到相当高的要求。特别是应用于业务实际场景时,要求就会更高,这是要重点关注的核心因素。
  3、FLinkSQL开发平台
  既然采用了Flink,那么FlinkSQL是绕不开的一个解决方案,传统的API方式,不灵活应用比较困难门槛也高,应对流批一体的场景,则显得力不从心。FLinkSQL自然而然就成为了首选。从之前的Sparkstreaming到python到Flink最终确定为FlinkSQL,一是从技术的发展路线,一是从需求的客观要求,从2方面决定了非FlinkSQL莫属。
  为什么采取FlinkSQL稍微展开下,主要有以下方面的因素:
  1)很好的社区服务,完整的生态,为实时的长期发展提供了必要的条件;
  2)健全的故障转移策略,高可用,动态扩展,实现7*24小时全天候运行,完善的Flink 度量系统以及成熟指标监控与告警配套方案;
  3)可基于SQL+UDF开发,极大地解决了开发难度的问题,扩展性方面也得到了很大的提升;
  4)提供了匹配多种业务,多种保障机制,比如状态计算、状态管理、高度灵活的窗口设置;
  简单说就是大势所趋,随心而动。
  如何构建平台?其实有比较成熟的一些方案,可以借助于Dlink来构建,从开发、调试、测试、上线各环节,完善开发工具,支撑起整体开发流程,解决开发、测试、发布人员的生产力,确保数据质量,提升整体的研发效能。
  4、展望
  说到展望,其实也是面临的最核心的一些问题是什么,主要是3个方面:
  1)准确性:实时目前比较期待的一个方式,是流批一体的实现,从Lamda架构到kappa架构的演进,真正解决数据准确性、一致性的问题,是一直在研究的课题,但现在应用其实都不是太好,继续努力;
  2)可用性和成本:目前资源的利用率是比较低的,如何通过资源的优化、调整,合理利用,得到长足的进步,降低费用成本;一个系统是否能很好的发挥价值,可用性、稳定性是一个非常重要的指标,目前事中事后的监控虽然能发现一些问题,但是基本都是问题发生后才知道,其实是会影响系统使用的,能否在事前进行监控,及早发现,把问题处理在萌芽状态,对于系统的稳定性是大有益处的。
  3)价值:任何一个技术平台,最终都要服务于业务,只有业务产生价值,技术平台才有生存的空间,所以场景挖掘方面,需要多关注,与产品经理起来,持续改进优化平台,服务好各个角色,让平台活下来。

美团又取消了这个支付方式?对于现在的996名上班族来说,外卖的出现是一大福音,外卖的生活已经很平常了。但就在本月24号早上,许多用户表示自己在美团APP上下单时,没办法使用微信付款?一时间,议论纷纷,许多网微信一口气更新了10个新功能!看看有没有你需要的?分享最实在的玩机技巧,洞察最前沿的科技资讯!大家好,这里是手机科技园!目前安卓和iOS微信,已经全部升级到了8。0。6版本,这次微信一口气更新了10个功能,下面就跟着我一起来挖掘吧机器人赋能医疗!然而,医疗机器人距离爆发还有四道关近年来,使用机器人替代人力劳作已经成为一大趋势。无论是家庭中的消费型扫地机器人,还是商场酒店中的清洁机器人,越来越多的机器人开始被应用到生活场景中。除此之外,在医疗领域,医疗机器人美国输掉5G,欲大力布局6G重夺第一,华为等中企将被卡喉咙?自从美国在5G技术竞争中失败后,便把希望全力投入到6G领域的建设当中,美国FCC决定开放太赫兹波频谱,为6G技术的无线设备建设一条发展路线。日本政府也很重视在6g领域的市场占领,总小米屏下前摄年度旗舰曝光支持120W有线和70W无线快充IT之家5月24日消息工信部此前无线充电(电力传输)设备无线电管理暂行规定(征求意见稿),自2022年1月1日所有生产进口在国内销售使用的移动和便携式无线充电设备额定传输功率要求小华为芯片断供两年手机缺货严重,去年旧机型都能涨价2000多元来源凤凰WEEKLY财经作者司雯雯编辑王毕强华为手机缺货严重。在美国芯片断供两周年后,已经成为部分事实。守着专卖店和授权店,店主们处在庞大销售网络的最末端,卖手机占了大半营收,感受红米Note10发布会前3天!配置特点大汇总,这些细节值得关注Hello,大家好,我是乐仔,最近的数码圈依旧火热啊,而且小米的好伙伴红米手机的芯片眼看着就要来了,这不我也是在网上搜集了一大圈,这才来给你汇总下关于这一次在5月26号即将发布的红华为即将正式发布鸿蒙操作系统,用户体验将迎来跨时代升级自从2019年5月21日谷歌宣布安卓系统将不再对华为手机进行更新后,华为便将研发了多年之久的华为HarmonyOS(鸿蒙操作系统)推上台面,向安卓和IOS系统发起挑战。时隔两年之后鸿蒙开源竞争对手们会转投华为阵营吗5月24日,在鸿蒙开发者创新大赛颁奖典礼上,华为消费者业务软件部总裁王成录表示,鸿蒙即将开源系统,并在武汉大学等15个学校开展HarmonyOS课程,这也意味着,以后其他品牌的电子华为正式官宣鸿蒙手机版相约6月2日EMUI官博更名为HarmonyOS预热已久的华为鸿蒙OS手机版,在经历三个beta版本公测之后,日前终于迎来了转正的官宣。日前华为和HarmonyOS官博正式官宣称了鸿蒙OS手机版将于6月2日发布的消息。并且此前的其它手机厂家用鸿蒙系统会受到华为限制?这是百分百的误解其它手机品牌搭载了鸿蒙系统,会受到华为的辖制?会影响到自己的市场吗?错!这是一个百分百的误解或是误读。华为早已宣布鸿蒙系统将会开源,并已把OpenHarmony捐献给了开放原子开源
家里人手机坏了,想在618的时候给他们换了,有千元机推荐吗?今年Realme打响618第一枪,优惠确实很大,官方说法是补贴7亿,并且还喊出618期间卖出100万台的小目标,不得不说真我此举还是很轰动的。考虑到这位伙伴看中的是iQOOZ3,那红米RedmiNote10Pro开箱安兔兔69万分1500元价位性能王者来了让很多人期待的红米Note10系列终于发布了,这次发布会上,红米Note10Pro也毫不意外地成为了主角。这款产品采用天玑1100芯片,虽然官方售价是1699元起,但6GB128G红米Note10Pro哪个版本性价比高?性价比最高的当然是6128版本了。才卖1499。但6128真心劝退!就现在这软件体积,用不上两年肯定空间就不足了。因此个人认为8256才是最实用的版本。但1999的价格就没有什么性怎样才能加到需要的微信群?找微信群太简单了,可以这样告诉你,每天要多少的群都有,并且都是免费的,直接分享一个大招给你吧,每天轻松找到50个微信群。找微信群的方式很多的,直接说一个最简单的,大家可以打开浏览器iOS15曝光全新UI界面iPhone13或原生首发苹果已经发布公告称,今年的WWDC2021开发者大会已经定档,时间在6月8日凌晨1点,届时用户们期待已久的iOS15系统即将正式登场。今天上午又有最新的爆料,此次的iOS15的锁屏台积电中芯国际联电纷纷扩产成熟的28nm芯片,这是为何?3月份的时候,中芯国际表示在深圳建厂,投资153亿,重点生产28nm的芯片,产能大约是4万片月。4月份的时候,台积电表示要投188亿到南京建芯片厂商,工艺也是28nm,产能大约是4便便被炸飞,表情包又出新花样,微信这是要干什么近年来,随着互联网高速发展,各式各样的社交软件不断走进我们的视野微信QQ探探绿洲除专门的社交软件外几乎所有的APP都涵盖聊天视频的功能。但是微信却独占鳌头,成为众多社交平台中的佼佼iOS14。5的推送再次激起大浪,苹果还要不要口碑?近日,iOS14。5正式版开始被陆续推送,越来越多的用户为了隐私保护功能而升级系统,可随之而来的又是一片谩骂声,不少iPhone11和iPhone12用户发现,自己手机的性能大大降识时务者为魅族?加入鸿蒙系统,未来放弃安卓12更新古人云识时务者为俊杰,这句话用在商战里面也未尝不可。就在华为不断完善鸿蒙OS2。0系统之际,谷歌也在本月高调发布了Android12,大有争锋相对的感觉。而鸿蒙OS2。0和安卓12格力150亿回购真的有利于股东吗?董明珠还好意思跟雷军站一起吗?董与雷不是一类人,董小姐是企业家,而雷军是商人。不要引战提这种问题的居心叵测,格力回购是董明珠的事情,和雷军和小米有什么关系啊。小米今年涨了好几倍,刚发的Q1业绩爆表,格力虽然从7618预售开始,红米K40高配2499促销量?realmeiqoo如何应对?其实最近realme和IQOO的性价比比性价比之王红米高多了。小米一直引以为傲的MIUI最近也让大家很是失望。所以单纯从硬件配置来看realme的性价比吊打红米。如618realm