范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

从卡脖子到主导,国产数据库40年的演变

  "六代繁华,春去也,更无消息。空怅望、山川形胜,已非畴昔。王谢堂前双燕子,乌衣巷口曾相识。" ——元词作家萨都刺《满江红·六代繁华》
  说起国产数据库的开山始祖,非人民大学的萨师煊教授莫属,而萨师煊正是元代文豪萨都刺的后人,萨师煊与其弟子王珊合著数据库系统概论,直到现在依旧是目前我国数据库领域的经典教材。
  早在 1978 年,萨师煊教授就开始为中国人民大学的同学们普及数据库的知识。而彼时刚刚恢复高考不久,数据库这个概念还属于非常新潮的名词,不过正是在萨老师的带领与指引下,国产数据库 40 年来由默默无闻到真正的爆发;从单节点到蚂蚁分布式数据库速度之王 OceanBase;从单一功能的 TP、AP 库到混合式 HTAP 数据库天云的 Hubble;从数据仓库、 数据湖 分立到仓湖一体的 MaxCompute;从 SQL、NoSQL 再到 NewSQL 的 TiDB;从传统数据库到专业的物联网时序数据库 TDEngine;更遑论刚刚入选 Gartner 领导象限的最新一代阿里云数据库 PolarDB。
  2010 年 7 月 11 日萨师煊教授在北京与世长辞,而彼时像 PolarDB、TiDB、TDEngine 这些国产数据库的典范,根本都还没有出生。须臾之间,可谓是国产数据库的丰收年之 2020 已然进入了倒计时,从蚂蚁的 OceanBase 再破 TPC 速度记录,到阿里云 PorlarDB 首进 Gartner 数据库领域的领导者象限;再到华为 GaussDB 革命性功能全密态的发布,国产数据库可谓是精彩纷呈。而今时今日,读到这阕六代繁华,回首过往,实在令人感慨万千,在这里,谨以此文向数据库前辈们致敬,也希望能为正走在数据库道路上的从业者带来一些思考! 缘起——国际巨头的傲慢与偏见
  数据库的起源可以追溯到上世纪 60 年代。当时 CPU 刚进入集成电路时代,计算机算力、内存都较之前的晶体管时代有了大幅提升,不少企业也开始使用计算机进行数据管理。不过当时的计算机系统缺乏有效范式来描述复杂的数据关系,因此当时库管系统还一直处于非常简陋的雏形状态。
  直到 1970 年,关系数据库之父、IBM 研究员 E.F.Codd 在《Communications of ACM》杂志上发表了一篇名为"A Relational Modelof Data for Large Shared Data Banks"的论文,这也成为了数据库历史上的奠基之作。后来 A C M 在 1 9 8 3 年把这篇论文列为创刊 25 年中最具里程碑意义的 25 篇论文之一,因为在这篇论文中首次提出了关系模型的概念。
  关系本是数学中的一个基本概念,由集合中的任意元素所组成的若干有序偶对表示,用以反映客观事物间的一定关系。像数字之间的大小关系、人之间的亲属关系、商品流通中的购销关系等等。用关系的概念来建立数据模型,用以描述、设计与操纵数据库,E.F.Codd 是第一人。
  不过虽然关系型数据库的理论在 1970 年就问世了,但是市场上却迟迟不见关系型数据库的商用产品。这其中最主要的原因是 IBM 虽然率先提出关系数据库理论,但当时蓝色巨人的反应实在太迟钝了,他们在 1973 年才启动 System R 项目来研究关系型数据库的实际可行性,不过也受限于当时 IMS 层次型数据库火爆的销售情况,因此 IBM 对于 System R 项目的关系数据库不怎么感兴趣。
  1977 年 6 月,Larry Ellison 和他的甲骨文抓住了关系型数据库这个巨大的商业机会,并通过引入 SQL 语言、原子事务等关键特性,在数据库领域迅速站稳了脚跟,并在 1989 年正式进入中国。
  彼时,中国数据库市场上像 FoxBASE、dBase 之类的产品都远远没有 Oracle 那样突出的实力,因此,甲骨文入华后不到五年,恰逢我国推进"九七工程"(1997 年,在全国电信企业全面实现市话业务计算机综合管理),由于电话资费大幅下降,普通家庭都安装得起电话了,这也使甲骨文的 Oracle 数据库在中国的销售情况迎来爆发式增长,不过单向的技术依赖,让我们处于被动的位置。 一举打破 Oracle 垄断的支付宝核心 OceanBase
  随着移动互联网大潮来临,我国 IT 巨头应用方面的创新几乎做到了天下第一,无论是 O2O、共享单车、移动支付领域是如此类,我们做的确实好,但是各大科技企业的核心数据库 C 位却一直被 Oracle 与 MySQL 等国外产品牢牢把持着。
  不过国外厂商的最强神话终于在 2019 年的国庆节被成功打破。蚂蚁的 Oceanbase 数据库成功登顶世界上最权威的数据库评测机构 TPC(国际事务处理性能委员会)排行榜榜首。
  在今年 5 月,OceanBase 再次将自己之前创造的记录提升了近 11 倍,将甲骨文、IBM 等一众老牌数据库巨头甩在身后,正式宣告国产数据库落后于国际先进水平的时代已成过往云烟,自研数据库产品自此站起来了。
  不过回顾过往,彼时 OceanBase 的诞生纯属意外。OceanBase 的创始人阳振坤绝对是天才中的天才,在 1984 年考入北京大学数学系,3 年修完本科,不到 2 年硕士毕业。师从王选院士并获得博士学位后,32 岁的阳振坤就成为了北大首批长江学者奖励计划的特聘教授之一。如果继续沿着这条路走下去,相信阳振坤会成为萨教授那样的学术泰斗,不过象牙塔的生活对于阳老师来说还是太乏味了,受到了导师王选院士的影响,阳老师立志要做出一款能够名垂青史的作品。
  2010 年,45 岁的阳老师加盟阿里,组建了一支自研数据库的团队。
  2012 年,时任蚂蚁金服 CTO 的 程立 决定将支付宝 1% 的交易库存数据在 OceanBase 上进行试运行,而这一试不要紧,OceanBase 不负众望,超额完成任务成功运行了 10% 的数据,这也让 OceanBase 在阿里内部一战成名。 混合型 HTAP——天云 Hubble 数据库
  在传统关系型 TP 数据库的范式中,数据类似于随时会被加工改造的零件,而数据库则是零件的加工厂。举例说明,使用 ATM 取款时,取款人的账户余额和 ATM 的钞箱余额都是在数据库的加工下随时会变化的零件,因此 TP 数据库一般用于联机交易,关键是响应速度要快。而在 AP 数据仓库,则把数据看做是已经被加工好的成形货物,没有实时修改的需求,但是要进行大量的关联计算以挖掘数据价值,因此 AP 数据仓库大多被用于客户画像、营销策分析。
  而 TP 与 AP 相对独立发展的趋势,随着实际业务的需要而发生改变,例如银行实时风控体系、电商实时推荐营销系统等都是需要综合 TP 与 AP 特性的场景,因此 HTAP 的概念在 2014 年被 Gartner 正式提出。
  HTAP(HybridTransactional/Analytical Processing)是在保留原有在线交易功能的同时,强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。
  天云数据的 Hubble 就是一款整合了 TP 与 AP 特性的混合式 HTAP 数据库。值得一提的是,Hubble 作为原创国产数据库获得了全国首届信创产业生态创新大赛中的一等奖。
  在同一数据库实例下,同时 支撑 高并发低延迟的 OLTP 事务和海量密集计算的 OLAP 分析作业,这不是一个简单的任务,而 Hubble 的方案是引入损失函数动态评价 SQL 逻辑计划的执行成本、CBO 代价优化解析、Sharding 切片线程级别物理资源匹配不同计算负载、TP 和 AP 双引擎调度执行、随机和序列化 IO 对存储的访问、依靠数据副本机制同时支持 KV 键值存储和列存存储交出了完美的答案。这意味着一张表可以同时支持行存和列存,真正的融合了存储结构,避免了在交易和分析数据库间每夜 ETL 数据搬家的繁琐运维工作和数据冗余。
  天云 Hubble 数据库借助优化便捷 SQL 服务替代 ES+HBase 方案,节省昂贵 Hadoop 开发成本;以高并发实时流升级,完成了 Flink 不能处理更多事实表的金融反欺诈和复杂权益服务; 多表关联 AP 计算方面,Hubble 的性能是 Impala 的 231%,在开放的大数据生态中,Hubble 完全可以作为计算组件与开源组件协同工作,嵌入并服务主流数据中台环境。 NewSQL 的典范——TiDB
  2005 年,谷歌首次提出了大数据的概念。对于大数据(Big Data),Gartner 给出了这样的定义:
  "大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
  也就是说大数据是指传统的 SQL 数据库无法处理的大量数据,这也就是我们目前常说的 NoSQL 型数据库,这是一种基于 Key-Value 寻址的数据库,这种数据库专门为海量数据存储服务,不过 NoSQL 要求数据之间的关联计算不能太多,比如字节、快手这样的视频社交 APP,数据虽然是天量级的,但是用户每条动态之间所需要的关联计算不多,这样的场景下使用 NoSQL 数据库就比较合适了。
  而我们前文提到的 TP、AP 数据库,都要进行数据之间的关联计算,比如电商平台上客户的一笔交易既要更新商家的库存又要更新买家的 帐户 余额,或者基于用户画像时要将客户的各项理财变动情况进行整体建模计算,这种关联计算的场景就是 SQL 数据库的天下了。
  原本 SQL 与 NoSQL 的应用场景两不重叠,井水不犯河水。不过,从最新的如直播带货需求来看,要求数据库既提供海量数据存储服务又提供高性能关联计算服务,这就是 NewSQL 的领域。
  而打通 NoSQL 与 SQL 任督二脉,打造 NewSQL 数据库的明星产品中典范当属 PingCAP 的 TiDB 了。PingCAP 的联合创始人黄东旭出身于微软,不过黄东旭在程序员中绝对堪称异类,他不止是位编程高手,绘画和摇滚水平之高甚至还远在代码能力之上,是 IT 业内闻名的文艺青年,其创建的 TiDB(https://github.com/pingcap/tidb)数据库代码优雅,结构清晰,颇有艺术气息,用他的话来说 TiDB 的目标是尝试让用户像使用和操作 Oracle、MySQL 传统数据库那样顺手,与此同时,还能拥有弹性伸缩的高扩展、高可用性架构。
  PingCAP 今年有两个大动作,一是在数据库顶会 VLDB 上发表论文《TiDB: A Raftbased HTAP Database》;二是继续将云原生进行到底,其把 TiDB  与和  Kubernetes 紧密结合,使得 TiDB 用户可以快速对集群进行扩缩容,滚动升级,这也反应了 PingCAP 在技术方面有非常深入的分析和思考。TiDB 的设计架构定位就是坚定地朝着云原生 NewSQL 的方向发展。这也是 PingCAP 站上风口,在 D 轮融资 2.7 亿美元的主要原因。
  金融级核心——GoldenDB
  笔者作为一名长期从事金融科技的程序员,对于数据库技术对外依赖感触是相当深刻的,因为我国银行业的绝对核心——支付系统(CNAPS),直到 2013 年底,我们 才用 自研二代支付系统将国外方案取代。
  一直以来,一致性问题是金融级数据库的重要讨论话题。分布式数据库的语境下一致性就是指各个数据库分片的数据是否一致,何时一致。如果更新过的数据能被后续的访问都能看到,这是强一致性;如果能容忍后续的部分或者全部访问不到,则是弱一致性;如果经过一段时间后要求能访问到更新后的数据,则是最终一致性。金融级的数据库必须要保证强一致性,也就是只要数据更新,就必须被后续的访问所看到。
  在金融数据库方面,中信银行与中兴通讯联合研发的 GoldenDB 在今年 5 月份成功上线。GoldenDB 成功取代了在中信银行核心系统服役了几十年的 IBM AS400 据库。为解决一致性问题,中信银行的数据库专家们创造性的提出在 GoldenDB 数据库引入全局事务协调器 GTM,实现基于中间件的强一致性事务控制,完成分布式事务的全生命周期管理。保证异常场景下的数据一致性,解决分布式数据库可能的脏读问题,在数据备份/恢复过程中,保证各全局事务组的操作统一执行或回滚。
  分布式事务中最重要的是原子性和隔离性。所谓原子性就是指事务像原子一样不可分割,比如用户在支付宝上还信用卡,那么支付宝的余额和信用卡的还款记录就需要同时成功或者失败,不能出现一边成功而另一边失败的情况,一般来讲原子性可通过已提交事务的回滚来实现。
  真正的难点在于隔离性,隔离性主要是处理读写冲突和写写冲突。分布式事务提交时可能出现部分节点成功,而另外一部分失败的情况,此时中信银行的数据库天团又提出在这种情况发生时,将已经成功提交的节点上进行回滚。根据全局事务 GTID 在 Binlog 中查找已提交事务信息,生成反向 SQL 语句并执行以实现数据回滚。通过以上的机制,就保证分布式数据库可以用于银行的动 帐 类业务,防止错账的发生。最终,银行核心系统完全实现了分布式数据库的分布式迁移,并随之完成国产化替代。 传统数据库的终结者——PolarDB
  2010 年前后,中国的互联网企业普遍迎来了一波流量爆发。其中,继 2003 年推出支付宝以后,淘宝在 2005 年到 2012 年的交易迅速增长,交易额从 80 亿元、200 亿元到 1000 亿,直到破万亿。不过这种爆炸式增长,也成为了阿里人甜蜜的负担,因为阿里电联用户的增长速度已经渐渐超出系统处理能力的提升速度,而原有一直沿用的 IOE(IBM 的小型机、Oracle 的数据库和 EMC 的存储)中心化系统与这种高用户并发的场景几乎格格不入,且暂不论达到如此性能的 IOE 系统成本会有多惊人,问题的关键在于即使是当时最强大的科技公司,也没有经历过上亿用户同时在线的业务场景,使用国外的产品方案有如南辕北辙,无法真正解决问题。
  正因此,王坚院士率先提出去 IOE 的目标,通过打造阿里自己的技术来解决用户爆发工资长的问题。
  在 IOE 架构的系统中提升算力的思路是让服务器越来越强,云计算的分布式思路是只需要增加服务器节点的数量,就能处理更多的并发服务请求,而分布式系统的业务连续性,并不是靠高可用性来保证,而是靠整个服务体系的容错能力造就的。在不断探索的过程中,我们也诞生了新的分布式架构,通过发挥云计算的威力,使得看似普通的虚拟机集群,能够碾压一体机,能够为亿万用户同时提供优质的服务。
  欲戴皇冠,必承其重,很多公司都会要管理远超自身运维能力的大规模数据库集群,DBA 团队维护对于很多企业尤其是初创企业来说成本不低,因此DBaaS(Database as a Service)逐渐兴起。用王坚院士的话来说,「未来使用数据库服务就像使用自来水和电一样简单」,业界一般认为将传统业务上云成本可以降低一半,而将数据库业务上云成本可以降低三分之二,因此很多研究机构都认为云数据库才代表着数据库的未来走向,比如 Gartner 就预计到 2023 年全球 75% 的数据库都会跑在云上,可以说云数据库未来很可能会终结掉传统数据库的存在,因此谁能在云数据库方面依靠,谁就可以在云计算与数据库两个方面都取得优势。
  根据 Gartner 上周发布的 2020 年度全球数据库魔力象限评估结果,阿里云凭借 PolarDB 的强大性能首次挺进全球云数据库供应商的第一阵营,进入领导者(LEADERS)象限,而腾讯和华为也都入选了特定领域者象限,这是有史以来中国数据库首次有三家厂商同时入选 Garner 的魔力象限。
  Gartner 在报告中指出"阿里云拥有丰富的数据库种类覆盖度和完善的产品布局,为用户提供了多种关系型和非关系型数据库产品,还提供了混合云环境部署,同时集成了备份、数据迁移与同步等能力。"这样的评价也充分体现了阿里云 PolarDB 的不俗实力,同时也预示着像阿里云、华为这样的中国云厂商未来不可限量。
  PolarDB 的创始人李飞飞与阳振坤一样同样是少年天才,在初中毕业后,李飞飞直接进入了国家教委理科实验班,并被保送进入清华学习。博士毕业后他在犹他大学计算机系任教,从助理教授一路做到正教授, 后来在时任阿里集团 CTO 行癫的支持下,李飞飞加入阿里创立了 PolarDB。
  图片来源:阿里云技术公众号,已获作者授权
  PorlarDB 除了在索引结构、锁机制等传统数据库组件进行优化以外,还特别针对云服务特有的全球跨域数据同步与容灾需求,进行了重点设计,我们知道很多云服务客户的业务遍及世界各个大洲,因此对于云数据库的跨域数据同步也会有非常高的要求。PolarDB 全球数据库(PolarDB Global Database Network,PolarDB-GDN)采用了数据库物理日志异步复制的方案。PolarDB-GDN 通过高并发流水线技术将同步速度提升 7 倍,将数据跨大洲同步延迟控制在 2 秒内。全局读写分离技术结合多级别的一致性能力,让业务不用做任何的改造的前提下降低整体的访问延迟,全面满足了云用户的需求。 最后
  今年是国产数据库的丰收年,除了上述数据库外,国产时序数据库 TDengine 背后的涛思数据在 2020 年 4 月完成 A 轮 2000 万美元融资,8 月将集群版开源,连续 6  天在  GitHub 全球趋势排行榜上位居第一;OceanBase 在工行的理财核心系统得到应用与验证;PolarDB-X 应用于中国邮政核心系统中,帮助邮政成功渡过 1 亿件的交易峰值;中国联通基于 PolarDB-X 等技术重构了其核心 IT 架构,实现对 3.6 亿用户的无缝"广覆盖",成为全球最大的云上 BSS 系统。相信国产数据库的未来可期,也愿今日国产数据库之世如众人所愿!

米家显示器挂灯体验非对称光设计加持,完美替代桌面台灯作为一个就连睡觉都要开灯的人,有光,是我对我桌面的一个基础需求。在没上手米家显示器挂灯前我用的是台灯,虽然好用,但会占用我桌面一部分面积,有跟我同样烦恼的人吗?而显示器挂灯这类产品绕了一个圈,iPhone12系列回归直角边设计自iPhone初代到iPhone3GS其实一直都是圆角设计,看上去圆圆的,拿在手里很像一块肥皂。尤其是iPhone3G系列,光滑的背部设计让我个人是爱不释手,甚至我一度认为,3GS千元内最好的降噪体验,OPPOEncoW51入耳体验最近我体验耳机类的产品有点多,但说到支持主动降噪的真无线蓝牙耳机,确实有一段时间没有体验过新品了。而随着OPPOReno4Pro的发布,OPPO带来了它全新的TWS真无线蓝牙耳机OiOS14都有哪些新功能?安卓手机们肯定偷笑了今年我个人感觉苹果相对来说真的特别低调,从硬件到软件上的变化没有让我特别印象深刻的产品,或许iPhoneSE的真香价格算一个吧。与往年WWDC不同,WWDC20采用了线上发布会,整追求音质的运动耳机到底如何?vivo无线运动耳机入耳体验每次将关于TWS真无线蓝牙耳机的评测发布后,看到评论区总有人说不适合运动配戴,确实,我自己配戴部分TWS耳机时,一旦跑起来会感觉到有些松垮。在TWS真无线蓝牙耳机前,早有颈挂式的蓝两年之约终于兑现,荣耀X10Max大屏手机正式发布7月2日下午,荣耀夏季5G新品发布会正式举办,其中包括了呼声超高的荣耀X10Max5G大屏手机,拥有竞速蓝探速黑光速银三种配色。本次荣耀X10Max最大的亮点之一,就是正面的这块定万物互联系统构造图中,工业自动化一环离不开工控机辅助信息时代的发展,互联网成为其主要表现特征。经过几十年的发展,对互联网而言,技术上已经拓展了Web开发技术搜索引擎技术网络游戏技术移动开发技术视频直播技术等领域。而在处在红利期的互联苹果正式宣布4月20日举行春季新品发布会,新款iPadPro来袭苹果正式宣布4月20日举行春季新品发布会,新款iPadiMacAirPods来袭继Siri一夜之间泄密之后,苹果公司今天正式宣布,将于北京时间4月21日上午凌晨一点,在加州库比蒂诺Shazam每月识别的歌曲数量超过10亿首,AppleMusic强势布局今年WWDC21上,苹果向开发者推出了ShazamKit,这是一个新的框架,允许第三方开发者将歌曲识别服务纳入自己的应用程序。就在WWDC一周后,苹果公司表示,自Shazam服务推Windows10未来更新将改善对AirPods的支持Windows10未来更新将改善对AirPods的支持今年稍后的Windows10大版本更新将包括改进对苹果AirPods全系耳机的支持和其他蓝牙耳机以及入耳式耳机。微软在最新发布iOS15重磅功能LiveText,AR世界离我们更近一步iOS15重磅功能LiveText,AR世界离我们更近一步FaceTime一年一度的苹果全球开发者大会WWDC21如期而至,iOSiPadOSmacOSwatchOStvOS五大系
平淡无奇,且枯燥的ITX电脑装机前言众所周知,我是个爱玩ITX平台的玩家。夏天的时候尝试了酷妈的热门机箱NR200P,当时玩完还觉得欠缺点什么。值得我见着这台玩家国度Z11机箱。老实说,我口水这机箱很久了,从4月维护遗留系统的隐形成本有哪些?CIO总是需要平衡新旧技术系统和流程。一方面,他们要拥抱新事物,他们需要帮助企业应对新机遇应对挑战或提高效率。另一方面,他们要致力于现有技术,他们必须支持现有流程,并实现过去在硬件联发科下一代天玑旗舰游戏技术大揭秘旗舰玩家就它了这些年,手游这个词已经充斥了我们的生活,无论是男女老少,或多或少的都会接触一些手游。目前手游市场异常的活跃,多款手机游戏的日活用户都突破的千万,这说明用户对于手机玩游戏这件事是持认产业数字化转型三部曲上云用数赋智你的企业上对云了吗?深刻认识产业数字化转型的必要性1。1。数字化转型是新阶段高质量发展的内在要求经济社会的数字化发展是大势所趋。当前,大数据人工智能区块链等数字技术不断突破发展,与经济社会各领域深度融如何定义SaaS企业活跃度指标?众所周知,客户成功经理(CSM)工作中最关注的几个指标是客户数续约率金额续费率(含增购)产品使用活跃率NPS(净推荐值)其它指标都是滞后的,而活跃率是最及时的指标能看到企业使用Sa推动企业数字化转型的驱动与阻碍因素越来越多的制造商正在将数字技术集成到他们的运营中。对一些人来说,这是为了应对劳动力短缺,对另一些人来说,是希望提高效率,而对许多人来说,这是为了更具竞争力。最近,IndustryW考拉海购小众设计师品牌家居馆让你的生活更具品味家具有特殊的意义,一件老家具蕴含着回忆,一件新的摆件充满着故事,家居设计让每个人都能真心的体验到生活的真谛,考拉海购小众设计师品牌家居馆让你的生活更具品味。考拉海购的消费群体大都是玩家天啊,它要从屏幕里出来了天天写数字化转型,今天放松放松,一张一弛文武之道。带你看看7D动图!太神奇了,看了100遍才过瘾!快看!什么东西跑过来了?小家伙的可爱都要溢出屏幕了!国际刑警范儿,帅呆了!快躲开,参展规模再加码3M携多款低碳环保新品登陆第四届进博会11月5日消息作为进博会的老朋友,全球领先的多元化科技创新企业3M连续第四年参与进博会,携旗下四大事业部数百款创新产品悉数亮相。同时,2021年进博会上,3M进一步加码参展规模,展为什么数字化让我们变得更忙?数字化如火如荼,且数字化并不是从无到有,为什么人看起来反倒变得更忙了?我相信每一个奋斗在数字化领域的人,都有一样的感受,数字化迭代发展的过程中,似乎忙碌感永不停歇,有越来越多需要处从程序员的角度,来拆解物联网系统中的开发工作物联网的概念已经被炒了好多年了,奇怪的是市场中对这个概念的反应总是不愠不火。随着5G的迅速普及,不知道是否能够再次把这个领域带火起来。但是不管怎样,很多大学已经把物联网这个专业给坐