范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

金融企业选择与应用分布式数据库的7个核心问题

  本文根据苏强老师在〖2020 DAMS中国数据智能管理峰会〗现场演讲内容整理而成。
  讲师介绍
  苏强,腾讯云数据库资深经理,拥有多年ToB产品策划、产品运维经验。曾在多个知名企业任职产品经理,主导或参与多款业内知名的B端产品从0到1过程,部分主导产品已实现同类产品占有率第一。接手腾讯分布式数据库以来,主要负责腾讯云分布式数据库功能策划、市场能力建设、服务支撑能力建设和团队建设等。
  大家好,我是来自腾讯云的苏强。从腾讯云分布式数据库商用那天起,我就在分布式数据库团队里,所以可以很自豪地说,我是最了解腾讯云分布式数据库的人之一。今天我将和大家分享近两年来分布式数据库在金融行业里真实应用的细节与核心。
  一、金融行业现状
  目前国内大中型银行主要以国外厂商提供的大型主机和数据库解决方案来进行系统构建。由于近年来金融业务量的不断增长,以及银行数字化转型成为必然趋势。目前以国外大型主机和数据库为核心的架构已无法满足大规模交易和数据处理的需求。
  一方面:性能无法满足业务不断激增的处理需求,存在系统过载风险;另一方面:本身价格比较昂贵,维护成本居高不下。
  以手机银行、网上理财、互联网保险等为代表的金融业务创新快速发展,推动新技术正以前所未有的速度与力度发生深层次变革。
  这些技术发展,对金融服务模式带来重大影响,使得金融行业向数字化、分布式转型成为必然趋势,金融业务创新与科技创新正在相互促进,重塑金融行业系统能力。
  1、分布式数据库领域的百家争鸣
  多种架构长期共存:分布式数据库经过这么多年的发展,实际上并不是一种新兴的技术了,从最早基于中间件的模型开始到现在基于分布式存储的架构,这些架构一直在并存着往前发展,谈不上哪个更优秀,因为都各有各的应用场景。
  多种技术栈卡位竞争:分布式技术目前发展的方向是,技术栈有兼容MySQL的,也有兼容Oracle的,也有兼容PG的,各技术栈现在互相卡位,在国内的厂商之间,几乎每个厂商都跟着一条线。
  厂商互相PK:目前投入的厂家,特别是在这两年国家对这块的支持力度和资本介入之下,做分布式数据库的厂家越来越多,形成了互相竞争的关系。
  2、金融客户应该如何选择分布式数据库
  抛开所谓的金融产品的可靠性、可用性等技术点以外,选择一个金融分布式数据库最核心的要点我认为是以下四方面:
  质量可靠:产品应该成熟可靠,经过大规模业务持续验证,拥有较多的客户案例和ISV集成经历;
  团队建设:建立能用、会用、用好国产数据库的人才队伍;形成一支具备高水平维护能力的队伍;
  持续演进:背靠优质平台或生态,产品可以持续演进发展;厂商拥有一流的研发团队和长期投入;
  服务能力:在国内主要地市建立健全分销体系、培训能力、服务团队。不仅包括数据库,更能覆盖金融全技术栈的服务能力。
  3、腾讯云分布式数据库解决方案
  腾讯云分布式数据库最早源自于腾讯的增值业务,从充值Q币开始到财富通、微信支付、微众银行,腾讯的分布式数据库一直是基于开源的自主研发。最近几年我们开始逐渐面向产研结合和产用结合,在产研结合方面我们和国内顶级高校建立了联合实验室,也在国际上发表了多篇顶级论文;在产用结合方面我们和很多银行建立了联合实验室,共同促进产品发展,目前主要应用的是我们TDSQL和TBase两条产品线。
  二、金融应用实践
  接下来将分享一个关于某金融客户主机下移过程的真实案例,希望能真正给到大家一些启发。
  抛开细枝末节,只聚焦在数据库上,我们怎么样把数据库的核心往下切?当时我们总结出了以下七个问题:
  如何选择分布式技术栈;
  如何设计信息技术创新节奏;
  如何使用分布式数据库;
  新老系统的切换;
  分布式的扩展容灾方案;
  如何对国产数据库进行运维;
  其他典型场景分布式数据库如何适配。
  1、分布式技术栈的选择:对主流方向都有布局和应用
  对于分布式技术栈的选择,目前有两个主流方向,一个是兼容MySQL,一个是兼容Oracle。
  兼容MySQL的优势是其分布式技术栈比较成熟,易于团队建设。基于MySQL的分布式协议最早来自于国外的一些互联网厂家,后逐渐引入到国内的互联网厂家,包括国内的微信支付、蚂蚁金服等几个巨头的支付厂家,其底座都是以兼容MySQL协议为主,再加上这么多年国内开发者对MySQL的研究,所以在此背景之下,金融机构的相关团队建设是比较容易成型的。
  兼容Oracle的优势是对整个金融系统的改造、迁移、使用成本相对较低,有可复用的部分并且方案相对简单。
  所以说这两个技术栈方向都各有优势,腾讯云因为金融业务足够大所以覆盖了这两个方向的产品,都有自己的产品线,我们现在都把它叫做分布式数据库产品线,分别是MySQL技术栈的以及Postgre技术栈的产品。
  2、技术创新节奏
  1)某大型银行客户的主机下移"五年计划"
  了解过技术栈的选择,接下来就是考虑自身团队适合哪款产品、选择这款产品后怎么设计核心系统等。以下是某大型银行真实计划的缩影,他们给整个过程设定了五年计划原则:
  技术团队:建立一支熟悉分布式数据库技术栈的技术团队;
  分批改造:根据业务重要性,分批分阶段改造业务系统;
  业务磨合:技术方案应在不影响宏观稳定,确保业务与数据库磨合;
  技术复用:该技术应该是可以复用或容易建立的;
  全量切换:应该是在完全磨合好以后,再全量切换。
  并且分成四种节奏开展落地:
  2018~2019年,团队招聘与培养:确定基于Oracle+MySQL实现双技术栈团队建设,并选择互联网银行业务选择开源MySQL方案打磨团队;
  2020年,(试点)核心系统改造:团队对MySQL熟悉后,实现核心业务系统基于腾讯云TDSQL上线并开始运营;
  2021年,新老系统并行,剩余系统改造:老业务系统不下线,数据保证实施同步回老业务系统,如果新业务系统一旦故障确保老系统可用;
  2022年,最终核心交易全量切换:在运行一段时间后,确保新系统完全稳定后,再封存老系统。
  2)某银行客户传统核心业务系统改造过程
  以上是另一个银行客户的案例,他们的客户规模相对于上面的银行小一些,所以进程较快。他们在2018年4月选择了某一个技术栈方向,并且开始POC测试,联合着长亮科技在2018年底到2019年初就在业务系统改造生产完成,并且在2019年上半年通过了相关专家机构的评审,正式上线。在2019年年中投产,逐步投产后运行非常稳定,而且性能较之前有较大的提升,所以2019年底整个核心系统全部下移投产。整个过程经历了差不多两年的时间,过程中整个项目团队的工作是非常紧张的,而且也借助了大量的成熟经验和长亮科技能力。
  3、数据层下移的拆分策略
  1)水平拆分&垂直拆分
  在执行了相应的规划以后,就要考虑数据库改造中数据层下移的拆分策略。说到水平拆分就不得不提及垂直拆分,垂直拆分一般是在SOA时代,基于业务垂直拆分。
  分布式改造最主要的还是对其中一些业务核心户进行水平拆分,使其能够适应新时代新的科技金融业务的发展。但也并不是所有的系统都需要分布式改造,有些规模比较小的系统就没必要。腾讯的产品是集中式和分布式组合在一起的,便于客户只买一个产品,能满足几乎所有数据库的需求。
  2)水平拆分的主要方案
  从实践来讲,数据层下移的拆分方案主要分为三种:
  第一种是按客户维度拆分:如上图所示,主要面向客户规模比较大、无明显分布性、交易金额小、笔数多等这种对私类业务,一般的拆分策略是一致性哈希。
  第二种是按分公司(法人)维度拆分:如上图所示,主要面向集团,其业务是基于分公司维度展开的,主要有几个特点——业务按分公司维度展开;交易/清算等以该维度展开;不同分公司交易规模区分明显;总部搭建业务系统和数据收口;分公司总数少但交易数量多。所以腾讯提供了一种叫虚拟组的能力,可以在分公司分布的基础上再进行拆分,帮助用户去提升。比如一个发展比较快的东南亚分公司,可能原来只需要一个小的分片,两年后爆发式增长就可以基于这种架构进行快速无缝的扩展。
  第三种是按时间维度拆分:如上图所示,通常是订单类的系统,而且按时间维度会涉及到大促时期呈峰值增长的问题。这种场景下,腾讯的产品可以提供一种二级分区的能力,可以按照时间分区,这就意味着无论归到历史库也好还是这一时间阶段交易规模比较大也好,都可以均衡地负载性能。
  4、新老系统的切换:DTS-DBBridge
  接下来就会涉及到研发,一旦涉及到研发就要考虑整个业务系统迁移的流程。这个流程从最开始的业务沟通,腾讯就可以开始介入,腾讯的技术人员可以通过我们成熟的迁移工具DBBridge输出对业务系统迁移的评估报告,同时配合开发人员进行业务系统改造、实施、新老系统的并行上线以及到最后的切换,整个服务体系都可以形成一个闭环。
  5、国产数据库的运维:DBBrain&分布式数据库管理系统
  迁移完成后就涉及到如何管理数据库,这里涉及到我们另一个方案DBBrain,它能够帮助用户从全局角度分析分布式数据库运行的情况,其中积累了腾讯海量的运维经验。
  6、分布式多活多SET化扩展容灾方案
  运维起来以后,随着运行一年到两年,某些核心就要开始考虑是否要符合监管的要求,是否要做两地三中心和容灾,甚至随着金融业务呈爆发式发展,原有的机房已经不能满足需求,需要换多机房方案。
  传统的两地三中心容灾方案,从金融科技发展角度会呈现出一些小问题,比如容灾需要人工干预,当真的面临事故时,是否敢做切换的决策?实际上很多金融IT从业者都不敢打包票。另外就是备机房常态下无流量,利用率较低,所以现在发展出多活的容灾方案,简单来说就是把业务系统通过一层网关进行一个按SET的划分,每一个SET下面都对应一套数据库,这个数据库既可以是集中式也可以是分布式。腾讯主流金融方案,都是使用多SET的模型。
  SET的主从之间是采用数据库的强同步,SET与SET之间同类业务采用数据同步模型,因为上层的SET做了业务拆分,所以两个SET组之间的数据是不冲突的,可以互相进行同步。这类架构目前也在国内的某头部保险公司,同样是腾讯云的客户,已经试验了两地四中心的架构,到目前为止已经稳定运行超过9个月,单个SET能承载的理论容量是10TB,TPS是5000以上,而且性能可以基于SET化的分布式扩展往上加,所以SET化可以扩展的能力是很强的。
  7、典型场景
  腾讯的产品还有哪些场景真正面向金融行业?下面给大家列举几个典型场景。
  1)异常场景的恢复&全局一致性数据分析
  第一种是异常场景的恢复和全局一致性数据分析,这个场景的功能和模型是差不多的,只是应用场景不一样。举个简单的例子,到年终结算的时候我需要2020年凌晨零点整的全年全部数据的一致性快照,可以有两种方式,第一种是生成一个新的实例,第二种是生成一个新的快照。这里会存在一个问题,因为分布式情况下服务器的系统时钟不一定一致,所以如图中上者需要进行分布式的补查,下者需要一个GTS绝对时间戳来保证数据的准确。
  2)分布式事务实时强一致
  第二种是分布式事务实时强一致的能力,举个例子,假设我有五张银行卡,因为我要还房贷所以钱从这些卡之间转来转去。这时我媳妇正好在我转账时来查账,就会有两种结果:第一,我媳妇过十分钟后来查账,她查询到的就是我转账后的余额情况,这种叫最终一致性;第二,我媳妇在我转账过程中就来查账,这时就叫实时一致性。实时一致性就是要保证在交易过程中,即时随时查账都能得到最准确的结果,这也是我们数据库当前能够支持的一种能力。
  3)渠道类业务冷热数据不均
  第三种是渠道类业务冷热数据不均,针对金融行业因为有大量的渠道业务,会出现严重的冷热不均衡。以微信支付为例,京东是我们最大的渠道之一,它一家的体量顶得上街边小的收银渠道几千家的体量,这就会遇到一个问题,我的大商户和小商户怎么分布才能使得整个资源利用率是最佳的,所以我们提出了冷热数据均衡的能力。我可以把一堆小商户放到专门小商户group里面,大商户放在大商户的group里面。
  4)复杂SQL处理(跑批等)
  第四种是复杂SQL处理(跑批等),在金融行业里有时使用开源的分布式数据库一遇到跑批就死掉,这是很正常的现象,因为数据量大了以后计算节点无法承载。所以我们提出了基于CPU的策略优化方案,简单来说类似于并行计算,把计算层的节点、计算层要做的事情往下推,推到数据层来做,原本需要在计算层几百个G的数据,下推后需要计算层处理的数据可能就只有几个G。因为通过计算层和计算层之间,数据可以做到打通和交流,这样就极大的提高了批处理的效率。
  5)分布式弹性
  第五种是分布式弹性,也是金融行业会遇到的比较典型的场景。上图是美国今年熔断,富途证券的峰值达到50亿次。所以分布式的扩展性能帮助我们在面对这种比较极端的、无法预料的情况下,整套性能能够很快速的扩展到所需要的目标。
  三、总结
  >>>>
  Q & A
  Q1:我了解现在国内做分布式改造无外乎是三种方式,一种是腾讯这种直接改造传统的结构化数据库,腾讯这两个产品都应该是这种模式吧?还有一种是增加一层分布式中间件,国内也有厂商做;第三种是基于谷歌Spanner论文做的产品。请问您怎么看这三种方案的优缺点?
  A:您说的这种方式就是刚才我提到的现在多种业务架构并存,腾讯的方式准确来说也不是基于中间件简单改的,它实际上是把三种技术能力进行了融合。针对您所说的三种方式,现在确实各有优缺点。
  首先基于谷歌Spanner的方式,它的优点是想象空间比较大,所以很容易实现行列混合存储能力。缺点是它的计算层层比较重,所以它的最大可扩展性和最大的理论性能是有限制的;另外因为该技术是新发展技术,所以大规模应用于称金融行业可能还需要一些时间。
  然后基于中间件的方式,优点是性能特别好,缺点就是业务系统要配合,而且对于语法的兼容性相对来说比较差,不太适合金融行业。
  腾讯是属于偏两者中间模型,既吸收了NewSQL的能力,又支持像分布式中间件的可靠性能。它的特点是性能、语法兼容性相对来说比较高、底层存储当前虽然是结构化存储,因为我们把计算层往上提了,提了以后下面存储到底是用MySQL、用PG,还是用NewSQL的KV存储?对我们来说设计就比较灵活,所以我们内部三种形态都有使用。目前因为是面向金融行业,主要还是商用的最成熟,所以主要还是推我们自己最成熟的TDSQL和TBase那一套方案。未来我们内部也有新的方案也在打磨,我们也会发布新的产品能力出来。
  Q2:企业里使用TDSQL的话,您是建议部署在物理机上还是腾讯私有云平台上?
  A:因为数据库本身是一个软件,理论上来说是可以部署在物理机和虚拟机上的。但因为生产环境目前虚拟机对数据库所需要的高IO,当前虚拟机对此类高IO优化做得效果不太明显,所以我们目前的建议是部署在物理机上。如果是一些测试环境或非核心环境也是可以部署在虚拟机上的。
  为了帮助大家部署在物理机上,方便管理以及进行资源的有效分配,我们所有数据库部署在物理机上都会有一套自己的虚拟化模型,也就是说您可以在物理机上抽象出类似云的多租户的实例模型出来,可以给多个业务单位或者个人使用。

小学入学年龄有调整,出生月份不再是入学标准,教育部回应来了家中的神兽可是让很多的作为教育者的家长犯愁,大家也知道这些神兽指的是谁,没错,就是家中还没有入学的准小学生们为什么说没有入学的准小学生呢,因为这些准小学生有的已经到了入学的年龄了,就业率创新低的4个专业,985名校毕业也无济于事,过来人后悔不已鸟欲高飞先振翅,人求上进先读书李苦禅读书是人类求知的途径,读万卷书行万里路并不是个空话,书读得越多,人们的见识越多,书中自有颜如玉,书中自有黄金屋。其实说得很对,有很多人因为读书改宁招名校本科生不招留学硕士,海归为何不吃香了,听听HR怎么说教育内卷化越来越严重,学历的贬值现象也是越来越严重,很多本科生决定毕业接着进行深造,考研几乎成为了大势所趋。而且这种现象大有愈演愈烈的势头,因此考研的难度上升了很多,也就是说报考人师范大学录取分数升高,财经高校报考人数下降,教师的铁饭碗真香现在人们探讨到什么是赚钱比较多的行业,很多人都回答当然是和钱有关的职业啊,金融财经成为了大多数人认为的比较好的行业,但是其实身在金融,财经行业的人才更懂行情。今年的财经类院校的报考初二现象成焦点问题,父母再难也要陪孩子一起过,家长需知晓每一个学年段的孩子都有不同的特点,比如幼儿园的学生听话可爱,小学的学生调皮爱玩,而初中的学生呢,比较叛逆不听话,高中的学生有主见,有想法。其实不仅各个学年段的学生有不同的点,同一学储殷博士宁愿孩子回到传统的教育时代,一句话揭露教育内卷现象现在的教育方针是科教兴国,素质教育,重视孩子们的成绩的同时更重视孩子们的素质道德的教育,德智体美劳全面发展。但是我们深思一下,现在的教育是一定意义上真正的素质教育吗?曾经笔者的童年教师薪资将有大变化,这四类教师薪资大幅度提升,教师拍手叫好盘点这些铁饭碗岗位,老师,公务员,医生等岗位,都是为人们作出贡献的岗位,都值得我们去尊敬。尤其是作为一个培养祖国花朵的职业,教师的身上肩负着巨大的责任,教书育人是教师的天职,因此,三无家庭的毕业生,不适合报考公务员,理由现实又扎心每个人的出身都不同,有的是含着金汤匙出身,一出生就赢在了起跑线上,有的则出生在贫苦的家庭,什么都要靠自己去奋斗。现在市面上流行着两个词,三无家庭和三有家庭,三无家庭是指那些没钱,没工作后才知道,省内和省外上大学大不相同,千万别选错了虽然很多学生已经报考结束了,有的甚至已经拿到了录取通知书了,但是作为这件事情的亲身经历者,笔者还是希望和你们说一下。高考后报考的时候很多考生都纠结这样一个问题,就是去哪里上大学,留警察待遇如此好,警校招生却遭遇滑铁卢,背后原因竟和选科有关最近河南暴雨连连,引发洪涝灾害,这个事件引发了很多人的关注,大家在为河南祈福的同时,也同样担忧着这些救援民警的生命安全。警察是一个救死扶伤的职业,也是一个让无数人都尊敬的职业,很多大龄研究生找工作被嫌弃,HR的理由很心酸,你还在逃避式考研吗研究生现在逐年增多,不仅因为报考的人数变多了,也因为一些院校进行了扩招,研究生现在可以说是一个庞大的群体,不光名牌大学的研究生数量多,现在普通二本院校的研究生也是很多的。其实能够考
学区房对孩子的影响有多大?教育家父母的教育方式是关键文全文共2086字,阅读时间约4分钟表弟从小学习成绩优异,现在就读于国内一所知名大学,每每有人问起姑妈的教育方法,姑妈都会提到曾经的两次搬家,在表弟小学毕业后,他本应该到附近的一所体育分一涨再涨,为孩子考试加分,美国孩子的运动方式学起来文全文共2176字,阅读时间约4分钟最近跟表姐聊天,说起孩子寒假期间的安排。表姐说眼看要中考了,体育分一涨再涨,据说以后连高考都要参考体育成绩。原来只是注重抓孩子学习,现在得各种运春夏之交,这盘槐花炒鸡蛋要记得吃,掌握3个小技巧,花香不流失春夏之交正是槐花盛开的季节,一场小雨过后,在早市上就能看到不少人在售卖新鲜的槐花,价格不贵三元一斤,每次遇到我都不会手软,一定要买上一大包,回家做成美味给家人尝尝稀罕。想起小时候,包菜炒粉条原来是这样做的,难怪以前老粘锅不好吃,技巧全在这里包菜炒粉条是一道美味的家常下饭菜,平时在家里吃饭,不知道做什么菜的时候,就会炒上一盘包菜炒粉条,花钱不多味道香,配米饭吃滋味一绝。一盘好吃的包菜炒粉条,粉条不能结块,也不能稀碎,要体育中考800米ampampamp1000米跑步备考技巧中考体育长跑长跑讲究在跑的过程中要匀速。一般情况下都是匀速跑成绩最好但也不排除最后要冲一下。根据自己的训练水平,在比赛起跑时,都要猛冲一下,不要慌,冲几十米就会慢下来。然后,保持自工作让你感到心累?掌握搞定上司的二个技巧,职场拼搏不再走弯路职场人士是最容易出现亚健康的人群,因为工作压力大,节奏快,人的精力和时间大多用在了追求工作表现上,较易忽视自己身体的呼救。亚健康并不代表疾病,所以身体不会有明显的症状出现,只是你会凯恩斯对经济危机爆发的原因分析1929年到1933年,世界范围内发生了震惊整个资本主义世界的经济大危机,1936年,凯恩斯在观察到经济危机的相关现象之时,结合原先的经济学知识,发现新古典经济学中存在的诸多弊端,孩子叛逆期,不能打不能骂,家长该怎么办?叛逆期,是指青少年的独立意识和自我意识日益增强,到一定年龄阶段时迫切想要摆脱父母的监护,从而体现自己已经成人的身份,并在这种情况下为了展示自己与他人的不同,而对任何事物采取批判与反美国新兵扔手榴弹却被树枝弹回,炸开1000枚钢珠参军打仗是一个非常危险的事情,无论在任何一个国家都是如此,即使一些国家比较和平,但是这些军人在训练和进行演习等各种任务的时候,也会出现一些意外的事件,即使是实力再强大的军队也不能够犹太人骨子里的灵魂做只永不放弃的青蛙有三只青蛙同时不小心掉在鲜奶桶中。第一只青蛙说这是上帝的意志,不可违抗。于是,它盘起后腿,等待奇迹发生。第二只青蛙说这桶太深了,没有希望了。于是,它在绝望中被淹死了。第三只青蛙说尽没有获得政府一分钱资助,他却使得奥运举办盈利2。5亿美元说到经商,大家应该都知道犹太人首当其中。下面来分享我之前在一本书中看到过的一个故事。1978年,洛杉矶市获得了奥运主办权。一个月后,市会议通过了一项不准动用公共基金来举办奥运会的宪