范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

焦点分布式数据库走到拐点

  随着数字经济的大力推行,数据量呈现爆发式增长, 数据管理模式也发生着急剧的变化, 传统的集中式架构数据库在很多应用场景下显得捉襟见肘, 新型的"分布式架构数据库" 正逐渐成为数据库技术研究和应用的热点。
  中国软件评测中心发布的《分布式数据库发展路径研究》报告显示,随着传统的数据库技术日趋成熟、计算机网络技术飞速发展、应用范围扩展,数据库应用已经普遍建立于计算机网络之上,基于此,集中式数据库系统便表现出它的不足之处,诸如:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成数据传输方面得开销;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理使得系统的规模和配置都不够灵活,系统的可扩展性差。在这种形势下,"集中计算"概念开始向"分布计算"概念发展。
  分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已经形成了一个分支。分布式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统"SDD-1"是由美国计算机公司(CCA)于1979年在DEC计算机上实现。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机/服务器模式发展。分布式数据库是传统数据库技术与计算机网络的有机结合,相比于传统的单机或主备模式的集中式数据库,分布式数据库在平滑扩展、性能、可靠性、可用性、成本、容灾备份等方面颇具优势,特别是在性能方面,它可以突破集中式数据库的瓶颈,具有很强的研究和应用价值。
  极具代表性的应用领域——互联网
  互联网行业是分布式数据库首先被重点应用的领域,极具代表性。数据量和系统访问量作为互联网行业的"根基",对于数据库的选择,是必须考虑的关键问题。随着数据量和系统访问量的增加,依赖纵向扩展的传统数据库架构,采用小型机、磁阵和商用数据库软件的购买和维护成本会越来越高。而采用廉价的PC 服务器、使用本地存储的分布式数据库,可以有效降低用户成本,同时还能带来良好的系统成长性。北京字节跳动科技有限公司(以下简称"字节跳动")作为互联网行业的龙头企业,对于分布式数据库的运用颇为"考究"。
  字节跳动数据库团队负责人告诉记者,字节跳动自主研发的分布式OLTP(联机事务处理)数据库,支持MySQL、Postgresql、Mongodb等多个开源生态,涵盖抖音、今日头条、西瓜视频等应用,教育、电商、直播等业务线。字节跳动数据库团队负责人透露,未来,字节跳动将结合其自身的工作负载和新的硬件、软件技术打造更多的数据库产品,在字节跳动内部实施更大范围的落地,并逐步开放给其他企业用户。
  目前,字节跳动旗下智能科技品牌——火山引擎,已将该数据库提供给外部企业用户使用。由于互联网行业的应用场景繁多且驳杂,包括各种大型促销活动、春节抢票活动、秒杀活动、节日抢红包活动等应用场景,都有短时间内数据并发量激增的情况。如果按照业务峰值提前采购计算资源,必然会导致资源浪费。对于这一点,OLTP数据库的表现颇为"亮眼"。
  字节跳动数据库团队负责人表示,从工作负载上看,字节跳动的分布式OLTP数据库拥有上万个实例,其容量可达到数PB之多,且具备较大的吞吐量。面对短时间内数据并发量激增的情况,OLTP数据库展现出良好的适应能力。例如,在2021年"抖音春晚红包雨"活动上,OLTP分布式数据库保障了"抖音春晚红包"活动期间"抖音APP"的稳定运行。
  "抖音春晚红包雨"活动面临的最大挑战,便是其数以亿计用户的"关系查询"问题。抖音的用户关系数据是抖音产品形态和数据分发的"中枢",如何存储海量的关系数据并保证在毫秒级内实现并发关系查询结果的反馈,是系统架构领域的难题。对此,字节跳动自研了分布式的"图数据库系统"——ByteGraph,该系统以"图(Graph)中点"和"边数据模型"来应对复杂多样的应用场景需求。
  分布式数据库被广泛应用
  由于分布式数据库产业发展良好,除互联网领域外,在其他重点行业也拥有诸多成功的应用案例。浪潮集团作为我国顶尖的大型IT企业,其分布式数据库的应用场景广泛,且具备良好的发展前景。
  浪潮ZNBase数据库总经理王小虎告诉记者,浪潮自主研发的Inspur ZNBase数据库(以下简称"ZNBase")已经实现了在金融、工业互联网、政企和智慧校园等行业的应用。ZNBase作为新一代的 NewSQL分布式数据库,参考了谷歌"Span -ner+F1"的设计思想,采用"去中心"架构,让ZNBase具备云原生、多中心、高可用、事务强一致等特性,满足HTAP (混合事务和分析处理)场景需求,有效地实现了对诸多行业的赋能。
  对于银行业,ZNBase可布局在银行的反欺诈系统项目中,实现将"商户黑名单风控子系统"及"公司业务事后风险监控子系统"从Oracle/Postgres数据库迁移到"ZNBase DB数据库"中。在金融领域,某信托公司的大数据分析与应用平台项目中,基于ZNBase构建的"统一大数据分布式数据库"与"数据ETL处理平台",进一步提升了信托业务贷后数据分析能力与监管报送能力。
  在工业互联网领域,ZNBase为某工业互联网大数据中心应用提供的OLTP/OLAP数据服务,以其高可用、高可靠的特性,在工业互联网场景下,实现了元数据管理、多租户权限管理、AI开发、建知识图谱等功能。
  此外,ZNBase还"涉足"政企、智慧校园等领域。王小虎透露,ZNBase已经部署在某市大数据局智慧政务系统及某大学海洋数据中台项目中。
  关键特性与显著优势
  分布式数据库之所以"备受追捧",缘于其在各行业领域的关键技术特性方面具备显著优势。北京人大金仓信息技术股份有限公司(以下简称"人大金仓")总裁杜胜曾发表观点称,任何事物都遵循发展的规律。例如,高质量的发展需要利用资源形成可量化的标准,故而人们不惜一切代价追求经济规模的持续增长和发展速度。
  但我们需要明白,在多个条件限制下实现的经济增长,其实现难度和基础成本的攀升,是整个世界和人类文明可持续发展的必然选择。
  在杜胜看来,软件行业同样遵循这样的发展规则,而这一规律在分布式关系数据库产品设计方面体现得尤为形象。设计集中式关系数据库的出发点,就是要充分利用每一份资源,但由于资源本身具备上限,即使能够支持数据库的垂直扩展,也很容易达到资源瓶颈。而分布式数据库的最大优势就是可以平滑地进行节点扩展,这样使得在系统运行初期,分布式数据库暂时不需要规划部署大量机器,随着业务增长,可动态增加节点,提升整体存储容量和处理性能,同时实现业务无感知的平滑扩容,以满足业务连续性要求。这种扩展能力,使分布式数据库通过机器横向堆叠实现存储容量和处理性能的提升,突破了集中式数据库由于硬件配置带来的存储和性能限制,以满足海量数据存储和高并发处理要求,可以达到几十万级 TPS、百万级 QPS 以上的处理性能。
  《分布式数据库发展路径研究》报告显示,分布式数据库一般基于通用的 PC 服务器和操作系统,数据也存储在本地磁盘中,其硬件成本,比传统小型机和高端磁阵有明显优势。特别是在节点扩展到一定规模后,不仅实现了集中式数据库无法实现的高并发,而且单个事务处理消耗的成本也会比集中式数据库显著降低。
  通常,分布式数据库都会采用多副本机制,一份数据在多个节点上保存,副本间通过Raft、Paxos等一致性协议保证数据一致性。当某个节点或者部分节点故障时,数据不会丢失,上层业务不受影响。在多地多活的分布式方案中,分布式数据库亦可以实现分布式单元化架构,保证数据一致性的前提下,向外提供稳定可靠高效的服务能力。分布式数据库的多副本机制实现了系统的容灾能力,提升系统可靠性。
  挑战与对策
  尽管分布式数据库具备独特的技术应用优势,但其发展也面临一系列问题。对于分布式数据库来说,其最大的挑战便是解决各个节点状态的同步问题。
  根据分布式系统的"CAP 理论",不存在一个分布式系统,既能保证数据一致性(C),也能保证可用性(A),还能保证分区容错性(P)。所以通常情况下,一般的分布式数据库会选择"CA"或者"CP",或者牺牲一部分"C"来换取"A"的提升。
  在分布式系统中,由于网络可能会出现延迟、丢包甚至中断等问题,导致分区容错性是必须要实现的,但是不同的应用系统对一致性、可用性和性能的要求各不相同,因此企业需要在一致性和可用性之间进行权衡。在杜胜看来,在分布式产品方面,目前行业内大多数企业的思路是在保障高可用性的前提下,更好地满足架构的弹性、伸缩性,这种思路可以在单节点效率不高的情况下,通过不断增加节点算力来提升吞吐量,继而支持线性扩展。简单来讲,这是一种"大力出奇迹"的思路,尽管采用不断堆叠算力的方式,可以解决整体问题,但这样的设计思路却并不完美,因为单节点的低效和节点间协同所带来的资源浪费也是显而易见的。
  在字节跳动负责人看来,产品方面,企业需要从多个角度分析。字节跳动负责人告诉记者,在字节跳动的架构中,存储层采用了Quorum协议,所以在数据库访问存储方面具备强一致性,而对于用户侧,除非用户有强一致性的需求,需要强制访问数据库的主节点,否则只对用户提供最终一致性的保证。"由于一份数据会以多个副本的形式存储在多个网络分区(可用域),在分区容错性方面,会在系统出现单分区网络故障时,保证分布式数据库系统的分区容错性。"字节跳动负责人说。他强调,如果数据库服务不可用,可能会导致前端业务失能,最终影响用户体验,所以保证系统的高可用性至关重要。
  王小虎介绍,针对CAP原则中的分区容错性,其ZNBase采用增强型RAFT共识协议来保证分区的强一致性,利用网络分区将原先的"Leader节点"和"Follower节点"进行分隔,若"Follower节点"无法收到"Leader节点"的信号,系统便会"选举"产生新的"Leader节点",介时便形成了双"Leader节点"的状态。由于原先的"Leader节点"独立在一个分区中,故而向其提交的数据便不可能复制到多数节点,最终无法实现提交。然而,"Follower节点"却可以向新的"Leader节点"成功提交数据,当网络恢复正常后,旧的"Leader节点"发现集群中有了新的"Leader节点",便自动降级为"Follower节点"并从新"Leader节点"处进行数据同步,最终达成集群数据一致。
  NewSQL 分布式云数据库
  针对CAP原则中一致性与可用性的权衡问题,王小虎透露,ZNBase主要提供以下几种方案,满足客户各种服务乃至同一服务下各种应用场景对数据库一致性和可用性的差异性要求:
  读取"节点"满足可用性
  采用配置数据就近读取的模式,在多数据中心的部署场景下,让应用连接最近的数据中心,获得其最新的数据。
  "强同步副本"满足一致性
  采用"两数据中心三副本"模式,该模式可实现当某一数据中心出现故障后,另一数据中心继续对外提供服务;"Leader节点"进行日志提交时,不仅需要提交日志,还需要强同步副本提交日志,以实现在任意时间段内,两数据中心同步读取到最新的数据。
  块设备同步(DRBD)方案满足一致性
  DRBD是在"存储设备层+网络层"实现高可用集群的资源代理(RA),一旦其中一个节点宕机,资源便会自动转移到另一个节点,从而保证服务的连续性。
  合理选择分布式数据库
  随着技术的不断演进,在市场中,种类繁多的分布式数据库系统不断涌现,选择一款适用、合理的分布式数据库系统至关重要。针对不同应用场景,选择与之对应的使用模式,是浪潮ZNBase决胜的关键。
  在浪潮ZNBase数据库总经理王小虎看来,利用ZNBase"多副本+地理分区标签"的特性,将数据调度到不同的机房、机架、机器,可以有效保障数据的一致性、可靠性,同时满足系统高可用性、可扩展性、容灾性。当部分机器出现故障时,ZNBase可以帮助分布式数据库系统实现自动切换,确保其RTO(恢复时间目标)不高于30s ,RPO (复原点目标)归零;针对数据存量、增量较大的应用,可利用ZNBase将所有的数据库整合成一个逻辑统一的数据库,以实现降低应用开发复杂度、提高应用开发敏捷性的效果;对于源数据库为POSTGRES(关系型数据库)或GP(MPP数仓)的部分用户来说,ZNBase可帮助其实现"一键迁移"。
  目前,ZNBase已实现将"列式存引擎"与"行式存储引擎"相结合,构建出HTAP(混合事务和分析处理)数据库,实现在同一个系统中进行联机交易处理、实时数据分析,抛弃了原有数仓作业中耗时巨大、操作重复的ETL处理流程,极大地节约用户的成本。无独有偶,在字节跳动看来,分布式数据库的选型,需要考虑以下四点。
  第一,应用对数据模型有无特殊要求,是否要求关系型模型/key-value模型/图模型。
  第二,应用访问数据库的逻辑是否有特殊性,其使用的SQL语法是否能得到100%的支持。
  第三,应用访问数据库的工作负载有何特点,读取和写入的占比多少,读取、写入QPS有无较明确要求。
  第四,可预测时间范围内,应用的数据存量和数据增量。
  结合AI技术实现分布式架构
  杜胜认为,采用分布式数据库首先要明确的一个前提共识:明确的规则是提高群体工作效率的基础,混乱适用于创造,秩序才能提高效率。所以,提供明确的业务规则并没有错,错的是这些规则无法随着外部环境的变化而随之自动变化,当环境发生改变时,静态的规则便难以为继。
  诚然,企业在最初赋予系统规则的阶段,是依靠以往的经验总结出来的,系统在运行过程中不断对各类访问行为进行收集和分析,并自动对已有的、不适应的规则进行调整,并重新对各个节点进行分工,同时调整节点的增减,这一切的工作都由分布式数据库进行统筹和安排。当外部环境发生变化时,依靠节点间的协调和沟通,发现并执行规则,以提升处理效率。企业需要在整个分布式关系数据库架构中增加规则的智能管理节点,节点在系统运行过程中不断收集、观测访问行为,同时将计算和存储分离,存储节点根据规则重新分布数据,计算节点则根据业务热点将多个存储节点的数据汇聚并进行缓存。
  杜胜说:"结合AI技术的分布式架构,本质上是分布式关系数据库数字化和智能化的实现。该架构一旦在实际项目中应用,系统会随着运行时间的增加,不断提高规则的适应性,继而提高整个系统效率。"
  应大力发展分布式数据库的技术、产品、生态
  随着分布式数据库在各行各业中的应用日益广泛,促使产品技术不断迭代,诸多挑战将逐一被攻克。未来,随着分布式数据库标准体系及评价体系的健全,分布式数据库产品的生态体系也将逐渐完善,在运维保障、数据迁移、运行监测等方面的配套工具也将逐步成熟。
  《分布式数据库发展路径研究》报告建议:目前,国内绝大部分数据库企业均推出了分布式数据库产品,我国分布式数据库发展基本与国际同步,在一些技术指标和应用层面处于领先水平,而且互联网、金融等领域应用场景对分布式数据库具有切实需求,当前应大力发展分布式数据库的技术产品,加快行业应用,促进数据库产业高质量发展。
  对于分布式数据库产业的发展,营造环境,打造分布式数据库的生态体系是重中之重。从产业发展角度来看,相比于集中式数据库,分布式数据库还处于发展的初期,技术体系、标准规范、测评机制、产品推广等方面尚不健全。第三方研究和服务机构应起到带头作用,联合推进技术标准、测评认证、迁移验证、示范试点等工作,共同营造良性的分布式数据库生态体系。目前相关企业发起了国产数据库的开源社区,并形成了部分商业发行版产品,这或许是建设分布式数据库生态体系的新思路。
  声明
  转载、添加白名单以及商务合作请在公众号文章留言,未经许可、不得转载,不得随意修改及盗用原文。
  中国信息化周报(信息化时代)
  官网:www.cio360.net

造型别致,搭载2。0L发动机一汽丰田卡罗拉CROSS有望广州车展亮相日前,网络上曝光了一组一汽丰田卡罗拉Cross的新车申报图,据悉,新车定位紧凑型SUV,将搭载2。0L发动机。外观方面,新车整体造型与此前发布的日规版车型区别不大,前脸采用了贯穿式新款QX60在美下线,国内申报图已亮相英菲尼迪还有翻身的机会吗?日前,2022款英菲尼迪QX60在美国田纳西州的工厂下线,新车起售价为46850美元(约30。3万人民币)。此外,国产英菲尼迪QX60申报图曝光,该车将国产销售,新车搭载2。0T发双门跑车再添新丁奔驰CLE或2022年亮相,有望推AMG车型日前,外媒曝光了一组奔驰CLE的新车路试图。据悉,新车为奔驰打造的全新车型,敞篷版及硬顶版将于2022年下半年首发,未来将接替奔驰C级和E级的敞篷版与轿跑车。新车外观采用家族的最新新首富的新挑战10月27日,胡润研究院发布2021胡润百富榜。榜单显示,67岁的农夫山泉股份有限公司董事长钟睒睒财富比去年增长250亿,以3900亿元首次成为中国首富。从1993年创办养生堂,打科普区块链让比特币技术带入汽车随着比特币的持续走高,很多朋友开始关心这种新兴事物和它背后的技术。目前区块链技术不仅带火了比特币,而且还给汽车互联创造了全新的功能和市场机遇。那么今天让我们聊聊区块链在汽车应用中的从创新到创心,今麦郎引领方便面市场创新新范式真正的创新我认为是从创新到创心,要提升一个台阶。如果我们企业不用心,没有抓住消费者心中的价值锚点,甚至没有推开消费者心门,就如同一片叶子没有根基,很容易被吹掉。在第二十一届方便食品华为无限流量卡来了!把宽带装进包小编推荐值三颗星华为这款流量卡公布出来以后,很多人都去找链接了。下单需同时选择华为商城里的华为随身WIFI3。这款设备内置电池达到1500毫安时,轻便小巧,满电最高续航六小时,可以AppStore限免WorkOther漫画滤镜Towaga等,共5款在今天限免的iOS限免应用中,波老师精选了以下4款限免应用,1款限免游戏。复制logo上方名字即可前往AppStore下载。如遇恢复原价,则表示限免已结束,请谨慎下载。具体下载方式电动牙刷日本PSE认证电动牙刷是PhilippeGuyWoog发明的一种牙刷,通过电动机芯的快速旋转或震动,使刷头产生高频震动,瞬间将牙膏分解成细微泡沫,深入清洁牙缝,与此同时,刷毛的颤动能促进口腔的血锂离子电池组CQC认证,锂电池CB认证,锂电池电芯CQC认证锂系电池分为锂电池和锂离子电池。手机和笔记本电脑使用的都是锂离子电池,通常人们俗称为锂电池。电池一般采用含有锂元素的材料作为电极,是现代高性能电池的代表。而真正的锂电池由于危险性大日本METI备案申请流程费用周期日本亚马逊METI备案是什么?日本METI备案如何收费?一日本METI备案是什么?日本经济产业省(METI)发布该方法详细信息,其制定者是该部门商务信息政策局的信息经济司,日本制定
担心手机影响孩子学习?OPPOWatch2或许是更好的开学礼物马上就要9月份了,也迎来了开学季。不少家长为了鼓励孩子学习,都会给孩子购买开学礼物,像新书包新文具新衣服鞋子,当然也可以适当给孩子购买电子产品。比如说智能手表,而相对于电子手表,我同样是土豪机,三星这两个版本的机型区别到底在哪?本文如下要说的正是三星的土豪机galaxyzFold3和galaxyzFold2,那么这两个版本到底有哪些区别的,小白乍一看似乎也没什么区别吧,不过一个是3跟2的区别,其实这两个版腾讯百度小米网宿加速推进IPv6规模部署工信部于8月25日召开了IPv6流量提升三年专项行动全国部署宣贯会,腾讯百度小米网宿等公司相关负责人介绍了IPV6相关的工作进展和下一步规划。腾讯表示,目前在公有云CDNIDCAp人口老龄化势不可挡,李成华用AI赋能养老,提高养老服务质量庞大的老年群体和紧缺的从业人员是当前养老行业中存在的痛点,面对势不可挡的老龄化趋势,武汉泰迪智慧董事长李成华用人工智能技术赋能养老,打造了国际顶级的智慧养老及服务,提供健康管理医养未成年人每天只玩一小时,游戏监管落地,网易B站盘前齐跌国家新闻出版署下发关于进一步严格管理切实防止未成年人沉迷网络游戏的通知。通知要求,严格限制向未成年人提供网络游戏服务的时间,所有网络游戏企业仅可在周五周六周日和法定节假日每日20时早高FENGAppleWatchSeries7或有独占新表盘三星将提高晶圆代工价格AppleWatchSeries7或有独占新表盘有传言称,即将发布的AppleWatchSeries7将采用更大的41mm和45mm表盘尺寸,随着尺寸的增加,苹果还计划增加利用更大每天5分钟,python速成(30)首先明确学习目标,今天的目标是认识python中的关键字参数关键字参数存放keyvalue形式的参数变量kwarg会存放keyvalue的参数,kwargs为字典。变量kwarg必5G逐渐普及,4G何时退网?工信部作出回应,这下放心了点击关注,每天精彩不断!导读5G逐渐普及,4G何时退网?工信部作出回应,这下放心了!众所周知,自从2018年底5G网络被提出以后,全球就快速的迈入到了5G网络时代,尽管说很多人都觉杨德龙继续看好新能源领域的四大赛道8月30日周一沪深两市出现波动走势,2019年我就提出新能源替代传统能源是大势所趋,建议投资者抓住新能源,长期的投资机会,特别是像光伏新能源汽车风电以及氢能源等是新能源板块的四大赛Python正则表达式保姆式教学,带你精通大名鼎鼎的正则正则作为处理字符串的一个实用工具,在Python中经常会用到,比如爬虫爬取数据时常用正则来检索字符串等等。正则表达式已经内嵌在Python中,通过导入re模块就可以使用,作为刚学P高性价比游戏本哪家CPU打游戏更强?酷睿i511400H对战R75800H暑假即将过去,又到了每年的开学季,所谓金九银十,这也是传统上电脑市场最火热的时候。不少大专院校的学生都会选择在这个时候购买一台电脑,不但可以用于学习,在闲时还能看剧打游戏,特别是男