范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

应云而生,智能湖仓如何成为构建数据能力的最优解?

  科技云报道原创。
  随着新一轮科技革命和产业革命深入交织,数字经济正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。
  在这一过程中,作为数字化底座的云,已经不仅仅局限于基础设施角色,更是企业持续创新和精益运营的关键支撑。
  能否从云上获取更多价值,将成为企业能否在数字时代拥有一席之地、持续领先领跑的关键。
  而云原生对基础设施的革新,带来了一系列"蝴蝶效应"。
  随着云原生技术已在互联网、金融等行业"落地开花",云原生基础设施不仅可以丰富数字化应用场景的多元化实践,也将为企业发展提供可持续的内生动力,"智能湖仓"便是其中最为重要的技术架构之一。
  作为"智能湖仓"架构的提出者,亚马逊云科技在云原生数据基础设施方面持续迭代创新。
  3月14日,亚马逊云原生数据湖S3迎来17周岁,在Pi Day 2023上,亚马逊云科技对Amazon S3发展历程进行全面回顾,不断激发数据的更大价值。
  从"数据仓库"到"数据湖"
  IDC统计显示,预计到2025年,全球数据量将比2016年的16.1ZB增加十倍,达到163ZB。
  数据的海量与多元化决定了从数据中获取有用的价值变得越来越困难,如果无法从数据中获得益处,那么数据价值就无从谈起。
  目前,数据的价值呈现两极化特征,一是及时发现,实时分析快速促进业务发展;二是长期存放,数据累积起来,探索数据后隐藏的规律,统一分析其价值,为业务发展提供参考。
  新的数据价值将给企业带来更多智能创新应用,比如增长黑客、推荐系统,用户行为分析,AIoT带来的更多模型,这也意味着IT基础设施的变革。
  传统数据处理方式,就像"涓涓细流",里面有ERP、CRM等各种业务系统,用户可以设计"一个河道",数据库在最底层。
  数据经过整理后形成中间层的数据仓库,然后通过商务智能工具(BI)来及进行展示。
  但在数字化时代,各种各样的视频、移动终端信息如"滔滔江水",形成大规模的海量数据,用户来不及整理和使用。
  这时,一个新的设想打开了人们的视野,假设有那么一片洼地,把所有数据先蓄积到里面,然后通过有效的工具进行查询和处理,这便是数据湖。
  国际研究机构MarketsandMarkets最新研究报告显示,到2024年,全球数据湖市场将突破200亿美元,增至201亿美元,复合年增长率将高达20.6%。
  可以说,随着数据治理与应用需求激增,数据湖成为数据管理的重要方式已成为不争的事实。
  数据湖的出现,很好的解决了数据仓库建设存在的一系列问题,将数据管理的流程简化为2个阶段,数据入湖和数据分析。
  数据湖一般以免运维、高可靠的对象存储为底座,支持各种数据类型的存储。
  对于用户来说,借助最新的数据湖解决方案,不仅能解决过去的数据孤岛问题,同时还能兼容传统的数据仓库和数据分析方法。
  最重要的是,更适合现代应用部署,比如和机器学习结合,进行预测性的分析。
  "智能湖仓"成技术新趋势
  随着数据湖概念的兴起,业界对于数据仓库和数据湖的对比甚至争论就一直不断。
  有人说数据湖是下一代大数据平台,各大云厂商也纷纷提出自己的数据湖解决方案,一些云数仓产品也增加了和数据湖联动的特性。
  不过在我们看来,数据湖与数据仓库并不是替代关系,而是互为补充、相辅相成,在此基础上的"智能湖仓"将能充分实现两者间的良性互动,成为未来重要的数据技术趋势之一。
  "智能湖仓"通过数据仓库治理能力的引入,既可以很好的解决上面提到的数据湖建设的问题,也为更好的挖掘湖中数据价值提供了基础,将高效建仓、灵活建湖的两大优势融合在了一起。
  不同于传统数据仓库的管理方式,"智能湖仓"极大地提高了数据开发的效率,同时降低了数据管理的难度。
  过去处理数据,需要资深的数据架构师定义数仓的规划,从数仓的分层、指标的定义到数据集市模型设计,然后交给专业的数据工程师进行业务开发,再由业务人员进行验证,有一套规范但却复杂的过程。而"智能湖仓"的出现,让企业能够快速的基于业务进行开发,又能够灵活的调整和规划自己的数据管理方式。
  另外,"智能湖仓"也让大数据行业内各个角色之间的交互变得更加自如。基于"智能湖仓"的数据管理理念,各类数据应用角色能够更好的相互协作,共同开发。
  如数据科学家可以方便的集成自己的数据并以纳入标准数仓流程进行管理、业务分析师也能够自己开发数据需求等。
  "智能湖仓"打破孤岛勾勒数据价值未来
  谈到"智能湖仓",不得不提到其最为重要的支撑——Amazon S3 ( Simple Storage Service )。
  17年前,亚马逊云科技推出了Amazon S3服务,首次定义了对象存储,S3由此成为对象存储事实上的标准,具有划时代意义。2015年,Amazon S3支持数万亿对象存储,平均在线峰值每秒可处理150万请求,设计为99.999999999%("11个9")的持久性。
  2022年,亚马逊云科技迎来又一座里程碑。Amazon S3存储的对象数量已经超过200万亿,每秒可处理数千万个请求。
  亚马逊云科技发布Amazon Redshift支持auto-copy from Amazon S3,从物理存储层面打通了数据湖与数据仓库。
  目前,全球数万用户都在使用Amazon Redshift分析数据库进行数据分析,这些用户来自游戏、金融、医疗、消费、互联网等。
  在十多年发展历程中,Redshift一直在持续迭代,很多功能和特性都源于企业的真实业务需求。
  具体而言,客户数仓场景主要包括四大块:
  第一,常规业务运营与BI分析;第二,实时数仓分析;第三,查询、报表与数据分析;第四,机器学习与分析预测。
  可以说,企业要想快速构建数据流水线,Amazon Redshift是底层基础设置的重要支撑。
  而凭借Amazon Redshift与其他数据分析应用的无缝集成,用户可以获得更完美的数据分析体验。
  比如:可以实现高性能格式存储数据,以更经济有效的方式将存储扩展到千兆字节,可实现存储和计算的分离,并且可以实现分析和机器学习引擎的选择等等。
  早在2017年,Redshift就已经实现湖和仓的融合,Redshift Spectrum可以直接查询在S3上开放格式的数据,当然也可以将数据写入到湖中,实现了数据仓库和数据湖的数据无缝流转。
  2022年,是Redshift推出正式满10周年。在这特别的一年,亚马逊云科技在年度大会上却一反常态,没有发布重大升级更新。
  取而代之的是,在会中推出许多新功能,都是和Redshift相关,从更紧密资料集成、流媒体资料分析到强化安全访问,力求要把Redshift打造成企业资料集散地,来符合各种现代化应用的使用,以及能汇集整理各种类型资料,提供AI分析和后续应用,更要让这个能够通吃各种资料类型的新一代数据仓库架构,成为加速企业资料现代化的关键产品。
  总体而言,作为亚马逊云科技的基石技术,Amazon S3不断为其技术创新提供源源不断的养分。而"智能湖仓"以Amazon S3为基础构建数据湖,作为中央存储库,围绕数据湖集成专门的"数据服务环",包括数据仓库、机器学习、大数据处理、日志分析等数据服务,然后再利用Amazon Lake Formation、Amazon Glue、Amazon Athena、Spectrum等工具,实现数据湖的构建、数据的移动和管理等。
  "智能湖仓"架构可以被视为一个"枢纽",将亚马逊云科技的数据服务无缝集成,打通数据湖和数据仓库之间数据移动和访问,并且进一步实现数据在数据湖、数据仓库,以及在数据查询、数据分析、机器学习等各类专门构建的服务之间按需移动,从而形成统一且连续的整体,满足客户各种实际业务场景下的不同需求。
  任何阶段的企业都可以从这种敏捷的架构中快速获益,轻松打破数据及技能孤岛,并以迭代及增量的方式获得数据分析的敏捷性,缩短企业提取数据价值的创新周期。
  这一架构充分利用了云服务带来的安全可靠、极致性能、无限扩展等优势,能够帮助企业消除数据孤岛,打造统一的数据基础底座,打通从数据获取到数据应用的完整流程,并让企业在云中实现数据与智能的深度融合,从而充分发挥数据价值。
  如今,亚马逊云科技已助力150万客户成为数据驱动型企业。
  以供应链的数字化升级为例,顺丰利用亚马逊云科技可大规模扩展的对象存储服务Amazon S3构建数据湖,将园区内大量的前端感知设备,包括摄像头、物联网IoT设备、地磁、多模达等收集的信息汇总到数据湖中。
  依托Amazon S3云对象存储近乎无限的存储能力,为数据驱动运营提供坚实的数据基础。
  通过使用亚马逊云科技计算、存储、数据分析、容器、机器学习和安全等服务,顺丰供应链改进了园区运营流程,提升了运营效率,园区车辆日吞吐量提升40%-60%,员工作业效率提升30%,调度员和安检员工作量减少50%。
  亚马逊云科技的另一个客户纳斯达克也通过Amazon S3为数据管理赋能。
  由于自动化交易平台涌入市场,交易速度和交易量持续增长,2014年,纳斯达克为了扩大规模、提高性能并降低运营成本,从旧式本地部署数据仓库迁移到由Amazon Redshift集群赋能的数据仓库。随着时间推移,越来越多的交易导致数据大量增加,同时,纳斯达克开始规划开发新架构以持续实现生态系统期望的性能标准和卓越运营。
  2018年,纳斯达克选择在Amazon S3上构建新的数据湖,这使该公司能够将计算和存储分开,并独立扩展每项功能。纳斯达克通过集成亚马逊云科技IAM策略、Amazon S3,还可在多个亚马逊云科技账户间提供全面的访问控制功能。此外,纳斯达克使用Amazon S3来存储关键的金融数据,并将其移至Amazon S3 Glacier,从而能够以较低的成本进行归档。
  2019年1月,纳斯达克参加了亚马逊云科技的Data Lab,在为期四天的实验中,纳斯达克使用Amazon Redshift作为计算层,重新设计了其提供分析的方式。因此,纳斯达克开始使用Amazon Redshift Spectrum,这是一项赋能智能湖仓架构的功能,可以直接查询数据仓库和Amazon S3数据湖中的数据。
  如此一来,洞察生成时间缩至最短,赋能斯达克经济研究团队可以进行数据分析,并对数据运行复杂的查询。起初是以性能为重点的解决方案,现在变成了团队间共享的多用途数据湖。
  借助基于Amazon S3和Amazon Redshift的新型智能湖仓架构,纳斯达克每天能够处理的记录数量轻松地从300亿条跃升至700亿条,并且较之前提前5小时达到90%的数据加载完成率。此外,通过优化其数据仓库,纳斯达克运行Amazon Redshift查询的速度加快了32%。
  鉴于良好的系统体验,纳斯达克于2022年已成功将其六大美国期权交易市场之一纳斯达克MRX的核心交易系统迁移至亚马逊云科技。此次成功迁移标志着纳斯达克为全球资本市场构建下一代技术基础设施之旅中一个重要的里程碑。
  无论是在数据基础架构、统一分析还是业务创新上,从连接数据湖和数据仓库到跨数据库、跨域共享,如今亚马逊云科技"智能湖仓"架构在企业中的实践,已经为企业构建现代化数据平台提供了一条可供遵循的路径,其将协同Amazon S3与Amazon Redshift等更多技术和产品,进一步推进底层数据架构的现代化演进,为企业乃至全行业带来更大的价值。
  【关于科技云报道】
  专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

童年4部恐怖剧少年包青天第4,看过三部你就是大神了上一次给大家盘点了2015年之后的几部现象级作品,很多人提出了好几部恐怖剧,今天就来聊一聊童年时期的几部恐怖经典作品吧。首先,挖片君要说的是,我们国家的恐怖片倒是一部接一部,但是没游戏艾迪芬奇的记忆一场向死而生的奇幻冒险一游戏剧情简介Finch家族关系树游戏的开始,一名游客乘坐渡轮前往位于华盛顿州的奥卡斯岛。他随身带着一本封面上写着艾迪芬奇(EdithFinch)的笔记本。我们的旅程就在笔记被翻开三夫户外股票杀猪盘往事近日,证监会披露了一张近亿元巨额罚单,涉事人是在微博拥有近40万粉丝的网络大V原上市公司董事易伟,消息引发震动。易伟的操作手法并不新鲜,从2018年11月1日至2020年6月19日丹麦看北极光惊艳程度不亚于其它北欧四国!说到北极光,人们首先想到的就是北欧的芬兰,挪威冰岛和瑞典!是的,没错!这四个国家是观看北极光的最佳地!而同样处于北欧的丹麦则是看北极光的小弟!往往很难看到北极光!然而近些天来,由于春日寻文访古,感受古建华章春风如约而至,吹过山海古城所到之处,草也青青,树也欣欣踏着春的旋律来钦州寻文访古感受不一样的古建华章刘永福旧居国家AAAA级旅游景区刘永福旧居座落在钦州市城区南面板桂街10号,建于冲刺迎办省旅发大会!百年青岛栈桥惊艳升级整装待发青岛新闻网独家(记者宋波鸿)进入3月,春回大地,万物复苏。百年青岛栈桥景区内,延续春节期间的火爆人气依旧热闹非凡上下翻飞嬉戏的海鸥与络绎不绝的游人,构成了最美好的早春休闲赏景图。3累计开放926条1800公里道路,开启自动驾驶新征程!一图读懂2022年度上海市智能网联汽车发展报告市交通委介绍,2022年,上海市智能网联汽车蓬勃发展,开创法规政策新元年开启自动驾驶新征程开拓数智融合新篇章,不仅颁发了全球首批智能网联汽车示范运营证,还开展了国内首例社会道路上的变异的平行线云游风物之旅变异的平行线摄影我是圆的(2022。11。11摄于福马线K417444下岐道口)变异的平行线作者我是圆的。变异的平行线已经裂变。由大而小最后聚焦在那个非现实的焦点上。眼川藏线看到大白菜可以摘吗?当地人不是白菜,摘了后果自负现在我们经济水平逐渐上涨后,人们的生活都得到了一定的改善。特别是现在新时代之下,很多人开始追求新鲜事物,而且开始享受高品质的生活。特别是现在旅游业的兴起,很多人开始外出旅行,不管是胆固醇,到底降还是不降?胆固醇肥胖脂肪垃圾食品虾胆固醇高吗?鸡蛋中的胆固醇含量是多少?如果您的目标是低胆固醇饮食,您可能会问自己这些问题。我们会抛出一个更好的问题这重要吗?需要明确的是,预防和降低高胆固醇长期不吃主食,人会变得怎么样?长期不吃主食会导致人体缺乏能量和必需的营养素,进而引发一系列的健康问题。首先,主食是人体获取能量的主要来源之一,长期不吃主食会导致能量不足,身体无法维持正常的代谢和生命活动,从而出
举办银企对接活动助力擦亮创业株洲万事无忧营商环境品牌为落实惠企纾困政策,缓解民营企业资金压力。3月28日,株洲市工商联举行今年首次银企对接活动,8家金融机构组团为民企赋能,总授信额度超21亿元。株洲市委常委市委统战部部长罗琼,市人民宝马董事长齐普策宝马将在中国使用低碳钢宝马集团董事长齐普策出品搜狐智库编辑王晓旭3月26日,宝马集团董事长齐普策在京参加中国发展高层论坛并发言。齐普策表示,坚信合作是经济发展的基础。增长是繁荣富裕的共同驱动力。齐普策说资讯宁德时代辟谣匈牙利工厂陷入停滞传闻假的,正按计划进行文懂车帝原创魏微懂车帝原创行业3月28日,针对有自媒体发布今年2月,宁德时代计划投资73。4亿欧元的第二座欧洲工厂,因遭到当地居民的反对而陷入停滞内容,宁德时代相关负责人辟谣称假的比亚迪再传收购巴西原福特工厂,王传福称目标是年底前成为中国第一大汽车制造商界面新闻实习记者刘嘉欣3月28日晚间,比亚迪发布最新财报显示2022年净利润166。22亿元,同比增长445。86。汽车销售方面,比亚迪全年生产188万辆新车,销售约180万辆车,浙江数字化观察县域如何搭上智造快车?智昌机器人张雨滴摄中新网宁波3月29日电(邵燕飞张雨滴)作为东南沿海地区的工业强市,特别是改革开放以来,浙江余姚大力实施工业立市战略,集中精力发展以制造业为重点的实体经济,书写了制清华大学无锡应用技术研究院电力储能高效集成技术研究中心启用聚焦能源技术创新共谋绿色低碳发展3月28日在滨湖区绿色低碳发展论坛暨清华大学无锡应用技术研究院第三届能源物联网应用技术研讨会上清华大学无锡应用技术研究院电力储能高效集成技术研究中心江西彭泽千亩梨花盛开勾勒乡村振兴新画卷航拍江西九江市彭泽县东升镇早熟梨产业基地。彭琴摄江西九江市彭泽县东升镇千亩梨花绽放,吸引游客前来赏花拍照。高明摄江西九江市彭泽县东升镇千亩梨花竞相绽放。彭琴摄航拍江西九江市彭泽县东拒绝效率拖沓高效办公一步到位许多人都希望能有一款便捷高效的笔记本电脑来应对工作中的新挑战,其中全能轻薄本华硕无畏Pro152022显然是上佳之选。其搭载AMD锐龙76800H处理器RTX3050显卡,辅以2。清明时节春渐暖艾产业有效拉动江西信丰经济发展央视网消息在江西,清明节前后有采制艾草制作春味的传统,艾米果就是当地清明时节的传统小吃。江西赣州信丰县大桥镇历来有清明时节制作艾米果的传统习俗。每到清明节前后,家家户户便会采摘鲜嫩围屋之都山水龙城,江西龙南到广州招游引客3月28日,围屋之都山水龙城龙南文化旅游(广州)推介会在广州市举行。正桂美丽乡村招游引客奖励!全年安排奖补资金600万元江西龙南市南接广东和平连平,具赣粤门户粤港澳大湾区桥头堡后花6队锁定季后赛!西部大局定了,湖人后来居上,最强附加赛队诞生NBA常规赛,已经到了收官阶段。一共6支球队提前锁定季后赛,他们分别为雄鹿凯尔特人76人骑士掘金和灰熊。国王尼克斯虽然还没有锁定季后赛,但领先优势巨大,距离锁定季后赛也就是时间问题