范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

面试官聊聊分布式事务,再说说解决方案

  前言
  开始我们今天的话题,说说分布式事务,或者说是我眼中的分布式事务,因为每个人可能对其的理解都不一样。
  分布式事务是企业集成中的一个技术难点,也是每一个分布式系统架构中都会涉及到的一个东西,特别是在微服务架构中,几乎可以说是无法避免,本文就分布式事务来简单聊一下。  数据库事务
  在说分布式事务之前,我们先从数据库事务说起。数据库事务可能大家都很熟悉,在开发过程中也会经常使用到。但是即使如此,可能对于一些细节问题,很多人仍然不清楚。比如很多人都知道数据库事务的几个特性:原子性(Atomicity )、一致性( Consistency )、隔离性或独立性( Isolation)和持久性(Durabilily),简称就是ACID。但是再往下比如问到隔离性指的是什么的时候可能就不知道了,或者是知道隔离性是什么但是再问到数据库实现隔离的都有哪些级别,或者是每个级别他们有什么区别的时候可能就不知道了。
  本文并不打算介绍这些数据库事务的这些东西,有兴趣可以搜索一下相关资料。不过有一个知识点我们需要了解,就是假如数据库在提交事务的时候突然断电,那么它是怎么样恢复的呢?为什么要提到这个知识点呢?因为分布式系统的核心就是处理各种异常情况,这也是分布式系统复杂的地方,因为分布式的网络环境很复杂,这种"断电"故障要比单机多很多,所以我们在做分布式系统的时候,最先考虑的就是这种情况。这些异常可能有 机器宕机、网络异常、消息丢失、消息乱序、数据错误、不可靠的TCP、存储数据丢失、其他异常等等...
  我们接着说本地事务数据库断电的这种情况,它是怎么保证数据一致性的呢?我们使用SQL Server来举例,我们知道我们在使用 SQL Server 数据库是由两个文件组成的,一个数据库文件和一个日志文件,通常情况下,日志文件都要比数据库文件大很多。
  数据库进行任何写入操作的时候都是要先写日志的,同样的道理,我们在执行事务的时候数据库首先会记录下这个事务的redo操作日志,然后才开始真正操作数据库,在操作之前首先会把日志文件写入磁盘,那么当突然断电的时候,即使操作没有完成,在重新启动数据库时候,数据库会根据当前数据的情况进行undo回滚或者是redo前滚,这样就保证了数据的强一致性。
  接着,我们就说一下分布式事务。  分布式理论
  当我们的单个数据库的性能产生瓶颈的时候,我们可能会对数据库进行分区,这里所说的分区指的是物理分区,分区之后可能不同的库就处于不同的服务器上了,这个时候单个数据库的ACID已经不能适应这种情况了,而在这种ACID的集群环境下,再想保证集群的ACID几乎是很难达到,或者即使能达到那么效率和性能会大幅下降,最为关键的是再很难扩展新的分区了,这个时候如果再追求集群的ACID会导致我们的系统变得很差,这时我们就需要引入一个新的理论原则来适应这种集群的情况,就是 CAP 原则或者叫CAP定理,那么CAP定理指的是什么呢?  CAP定理
  CAP定理是由加州大学伯克利分校Eric Brewer教授提出来的,他指出WEB服务无法同时满足以下3个属性:  一致性(Consistency) :客户端知道一系列的操作都会同时发生(生效)  可用性(Availability) :每个操作都必须以可预期的响应结束  分区容错性(Partition tolerance) :即使出现单个组件无法可用,操作依然可以完成
  具体地讲在分布式系统中,在任何数据库设计中,一个Web应用至多只能同时支持上面的两个属性。显然,任何横向扩展策略都要依赖于数据分区。因此,设计人员必须在一致性与可用性之间做出选择。
  这个定理在迄今为止的分布式系统中都是适用的!  为什么这么说呢?
  这个时候有同学可能会把数据库的2PC(两阶段提交)搬出来说话了。OK,我们就来看一下数据库的两阶段提交。
  对数据库分布式事务有了解的同学一定知道数据库支持的2PC,又叫做 XA Transactions。
  MySQL从5.5版本开始支持,SQL Server 2005 开始支持,Oracle 7 开始支持。
  其中,XA 是一个两阶段提交协议,该协议分为以下两个阶段:  第一阶段:事务协调器要求每个涉及到事务的数据库预提交(precommit)此操作,并反映是否可以提交.  第二阶段:事务协调器要求每个数据库提交数据。
  其中,如果有任何一个数据库否决此次提交,那么所有数据库都会被要求回滚它们在此事务中的那部分信息。这样做的缺陷是什么呢? 咋看之下我们可以在数据库分区之间获得一致性。
  如果CAP 定理是对的,那么它一定会影响到可用性。
  如果说系统的可用性代表的是执行某项操作相关所有组件的可用性的和。那么在两阶段提交的过程中,可用性就代表了涉及到的每一个数据库中可用性的和。我们假设两阶段提交的过程中每一个数据库都具有99.9%的可用性,那么如果两阶段提交涉及到两个数据库,这个结果就是99.8%。根据系统可用性计算公式,假设每个月43200分钟,99.9%的可用性就是43157分钟, 99.8%的可用性就是43114分钟,相当于每个月的宕机时间增加了43分钟。
  以上,可以验证出来,CAP定理从理论上来讲是正确的,CAP我们先看到这里,等会再接着说。  BASE理论
  在分布式系统中,我们往往追求的是可用性,它的重要程序比一致性要高,那么如何实现高可用性呢?前人已经给我们提出来了另外一个理论,就是BASE理论,它是用来对CAP定理进行进一步扩充的。BASE理论指的是:  Basically Available(基本可用)  Soft state(软状态)  Eventually consistent(最终一致性)
  BASE理论是对CAP中的一致性和可用性进行一个权衡的结果,理论的核心思想就是: 我们无法做到强一致,但每个应用都可以根据自身的业务特点,采用适当的方式来使系统达到最终一致性 (Eventual consistency)。
  有了以上理论之后,我们来看一下分布式事务的问题。  分布式事务
  在分布式系统中,要实现分布式事务,无外乎那几种解决方案。  两阶段提交(2PC)
  和上一节中提到的数据库XA事务一样,两阶段提交就是使用XA协议的原理,我们可以从下面这个图的流程来很容易的看出中间的一些比如commit和abort的细节。
  两阶段提交这种解决方案属于牺牲了一部分可用性来换取的一致性。在实现方面,在 .NET 中,可以借助 TransactionScop 提供的 API 来编程实现分布式系统中的两阶段提交,比如WCF中就有实现这部分功能。不过在多服务器之间,需要依赖于DTC来完成事务一致性,Windows下微软搞的有MSDTC服务,Linux下就比较悲剧了。
  另外说一句,TransactionScop 默认不能用于异步方法之间事务一致,因为事务上下文是存储于当前线程中的,所以如果是在异步方法,需要显式的传递事务上下文。
  优点:  尽量保证了数据的强一致,适合对数据强一致要求很高的关键领域。(其实也不能100%保证强一致)。
  缺点:  实现复杂,牺牲了可用性,对性能影响较大,不适合高并发高性能场景,如果分布式系统跨接口调用,目前 .NET 界还没有实现方案。 补偿事务(TCC)
  TCC 其实就是采用的补偿机制,其核心思想是:针对每个操作,都要注册一个与其对应的确认和补偿(撤销)操作。它分为三个阶段:  Try 阶段主要是对业务系统做检测及资源预留  Confirm 阶段主要是对业务系统做确认提交,Try阶段执行成功并开始执行 Confirm阶段时,默认 Confirm阶段是不会出错的。即:只要Try成功,Confirm一定成功。  Cancel 阶段主要是在业务执行错误,需要回滚的状态下执行的业务取消,预留资源释放。
  举个例子,假如Bob 要向 Smith 转账,思路大概是:我们有一个本地方法,里面依次调用 1、首先在 Try 阶段,要先调用远程接口把 Smith 和 Bob 的钱给冻结起来。2、在 Confirm 阶段,执行远程调用的转账的操作,转账成功进行解冻。3、如果第2步执行成功,那么转账成功,如果第二步执行失败,则调用远程冻结接口对应的解冻方法 (Cancel)。
  优点:  跟2PC比起来,实现以及流程相对简单了一些,但数据的一致性比2PC也要差一些
  缺点:  缺点还是比较明显的,在2,3步中都有可能失败。TCC属于应用层的一种补偿方式,所以需要程序员在实现的时候多写很多补偿的代码,在一些场景中,一些业务流程可能用TCC不太好定义及处理。 本地消息表(异步确保)
  本地消息表这种实现方式应该是业界使用最多的,其核心思想是将分布式事务拆分成本地事务进行处理,这种思路是来源于ebay。我们可以从下面的流程图中看出其中的一些细节:
  基本思路就是:
  消息生产方,需要额外建一个消息表,并记录消息发送状态。消息表和业务数据要在一个事务里提交,也就是说他们要在一个数据库里面。然后消息会经过MQ发送到消息的消费方。如果消息发送失败,会进行重试发送。
  消息消费方,需要处理这个消息,并完成自己的业务逻辑。此时如果本地事务处理成功,表明已经处理成功了,如果处理失败,那么就会重试执行。如果是业务上面的失败,可以给生产方发送一个业务补偿消息,通知生产方进行回滚等操作。
  生产方和消费方定时扫描本地消息表,把还没处理完成的消息或者失败的消息再发送一遍。如果有靠谱的自动对账补账逻辑,这种方案还是非常实用的。
  这种方案遵循BASE理论,采用的是最终一致性,笔者认为是这几种方案里面比较适合实际业务场景的,即不会出现像2PC那样复杂的实现(当调用链很长的时候,2PC的可用性是非常低的),也不会像TCC那样可能出现确认或者回滚不了的情况。
  优点:  一种非常经典的实现,避免了分布式事务,实现了最终一致性。在 .NET中 有现成的解决方案。
  缺点:  消息表会耦合到业务系统中,如果没有封装好的解决方案,会有很多杂活需要处理。 MQ 事务消息
  有一些第三方的MQ是支持事务消息的,比如RocketMQ,他们支持事务消息的方式也是类似于采用的二阶段提交,但是市面上一些主流的MQ都是不支持事务消息的,比如 RabbitMQ 和 Kafka 都不支持。
  以阿里的 RocketMQ 中间件为例,其思路大致为:
  第一阶段Prepared消息,会拿到消息的地址。第二阶段执行本地事务,第三阶段通过第一阶段拿到的地址去访问消息,并修改状态。
  也就是说在业务方法内要想消息队列提交两次请求,一次发送消息和一次确认消息。如果确认消息发送失败了RocketMQ会定期扫描消息集群中的事务消息,这时候发现了Prepared消息,它会向消息发送者确认,所以生产方需要实现一个check接口,RocketMQ会根据发送端设置的策略来决定是回滚还是继续发送确认消息。这样就保证了消息发送与本地事务同时成功或同时失败。
  遗憾的是,RocketMQ并没有 .NET 客户端。
  优点:  实现了最终一致性,不需要依赖本地数据库事务。
  缺点:  实现难度大,主流MQ不支持,没有.NET客户端,RocketMQ事务消息部分代码也未开源。 Sagas 事务模型
  Saga事务模型又叫做长时间运行的事务(Long-running-transaction), 它是由普林斯顿大学的H.Garcia-Molina等人提出,它描述的是另外一种在没有两阶段提交的的情况下解决分布式系统中复杂的业务事务问题。
  我们这里说的是一种基于 Sagas 机制的工作流事务模型,这个模型的相关理论目前来说还是比较新的,以至于百度上几乎没有什么相关资料。
  该模型其核心思想就是拆分分布式系统中的长事务为多个短事务,或者叫多个本地事务,然后由 Sagas 工作流引擎负责协调,如果整个流程正常结束,那么就算是业务成功完成,如果在这过程中实现失败,那么Sagas工作流引擎就会以相反的顺序调用补偿操作,重新进行业务回滚。
  比如我们一次关于购买旅游套餐业务操作涉及到三个操作,他们分别是预定车辆,预定宾馆,预定机票,他们分别属于三个不同的远程接口。可能从我们程序的角度来说他们不属于一个事务,但是从业务角度来说是属于同一个事务的。
  他们的执行顺序如上图所示,所以当发生失败时,会依次进行取消的补偿操作。
  因为长事务被拆分了很多个业务流,所以 Sagas 事务模型最重要的一个部件就是工作流或者你也可以叫流程管理器(Process Manager),工作流引擎和Process Manager虽然不是同一个东西,但是在这里,他们的职责是相同的。在选择工作流引擎之后,最终的代码也许看起来是 这样的  SagaBuilder saga = SagaBuilder.newSaga("trip")         .activity("Reserve car", ReserveCarAdapter.class)          .compensationActivity("Cancel car", CancelCarAdapter.class)          .activity("Book hotel", BookHotelAdapter.class)          .compensationActivity("Cancel hotel", CancelHotelAdapter.class)          .activity("Book flight", BookFlightAdapter.class)          .compensationActivity("Cancel flight", CancelFlightAdapter.class)          .end()         .triggerCompensationOnAnyError();  camunda.getRepositoryService().createDeployment()          .addModelInstance(saga.getModel())          .deploy();
  优缺点这里我们就不说了 , 因为这个理论比较新,目前市面上还没有什么解决方案,即使是 Java 领域,我也没有搜索的太多有用的信息。 分布式事务解决方案:CAP
  上面介绍的那些分布式事务的处理方案你在其他地方或许也可以看到,但是并没有相关的实际代码或者是开源代码,所以算不上什么干货,下面就放干货了。
  在 .NET 领域,似乎没有什么现成的关于分布式事务的解决方案,或者说是有但未开源。据笔者了解,有一些公司内部其实是有这种解决方案的,但是也是作为公司的一个核心产品之一,并未开源...
  鉴于以上原因,所以博主就打算自己写一个并且开源出来,所以从17年初就开始做这个事情,然后花了大半年的时间在一直不断完善,就是下面这个 CAP。
  Github CAP:这里的 CAP 就不是 CAP 理论了,而是一个 .NET 分布式事务解决方案的名字。
  详细介绍:
  http://www.cnblogs.com/savorboard/p/cap.html
  相关文档:
  http://www.cnblogs.com/savorboard/p/cap-document.html
  夸张的是,这个解决方案是具有可视化界面(Dashboard)的,你可以很方面的看到哪些消息执行成功,哪些消息执行失败,到底是发送失败还是处理失败,一眼便知。
  最夸张的是,这个解决方案的可视化界面还提供了 实时动态图表 ,这样不但可以看到实时的消息发送及处理情况,连当前的系统处理消息的速度都可以看到,还可以看到过去24小时内的历史消息吞吐量。
  最最夸张的是,这个解决方案的还帮你集成了 Consul 做分布式节点发现和注册还有心跳检查,你随时可以看到其他的节点的状况。
  最最最夸张的是,你以为你看其他节点的数据要登录到其他节点的Dashboard控制台看?错了,你随便打开其中任意一个节点的Dashboard,点一下就可以切换到你想看的节点的控制台界面了,就像你看本地的数据一样,他们是完全去中心化的。
  你以为这些就够了?不,远远不止:  CAP 同时支持 RabbitMQ,Kafka 等消息队列  CAP 同时支持 SQL Server, MySql, PostgreSql 等数据库  CAP Dashboard 同时支持中文和英文界面双语言,妈妈再也不用担心我看不懂了  CAP 提供了丰富的接口可以供扩展,什么序列化了,自定义处理了,自定义发送了统统不在话下  CAP 基于MIT开源,你可以尽管拿去做二次开发。(记得保留MIT的License)
  你完全可以把 CAP 当做一个 EventBus 来使用,CAP具有优秀的消息处理能力,不要担心瓶颈会在CAP,那是永远不可能, 因为你随时可以在配置中指定CAP处理的消息使用的进程数, 只要你的数据库配置足够高...
  2号传送门:https://github.com/dotnetcore/CAP  总结
  通过本文我们了解到两个分布式系统的理论,他们分别是CAP和BASE 理论,同时我们也总结并对比了几种分布式分解方案的优缺点,分布式事务本身是一个技术难题,是没有一种完美的方案应对所有场景的,具体还是要根据业务场景去抉择吧。然后我们介绍了一种基于本地消息的的分布式事务解决方案CAP。
  来源: http://www.cnblogs.com/savorboard/p/distributed-system-transaction-consistency.html

达人用Skydio无人机和后期CG打造现实版MarioKart想要在现实世界里面体验马力欧卡丁车系列(MarioKart),是一件比较困难的事情,但这并不会让某些人放弃。近日,独立制片人IanPadgham提出了一个非常有趣的想法在封闭的赛道英雄联盟手游真的要来了,近日开启内测资格,安卓玩家可以参与鲸乐丨文玩家们期待已久的英雄联盟手游再次放出新消息,而这次的消息预示着英雄联盟手游时代真的要来临了。这个消息的主要内容是,英雄联盟手游将开启先锋测试,邀请喜爱这款游戏的玩家们积极参每个石器时代的赛季日,都是令人最期待的一天石器时代PK赛季结算的日子又到了,一个赛季的努力都是为了这一刻图腾抽奖符文抽奖,今天我们家族群里有哀号遍野的也有喜出望外的,一切的一切都是命啊感慨命运的不公时又感叹世事无常,精彩精用科学创造魔法?无所不能的生化危机病毒,甚至能造出万磁王说到末日题材的游戏作品,相信很多人的第一印象肯定是生化危机系列,作为一款经典的恐怖游戏,游戏不仅有着优秀的玩法和系统,游戏的剧情也吸引了很多喜欢这类型游戏的玩家。游戏中的故事,都是8万元一台!纯金版索尼PS5有人用上了,不差钱的土豪下单吧点击右上方关注,第一时间获取科技资讯技能攻略产品体验,私信我回复01,送你一份玩机技能大礼包。5月11日,日本网红主播HIKARU(光)近日向粉丝展示其新玩具,一台价值140万日元云顶之弈后期永远的神!铁骑天使极限苟分姿势还有很多阵容都没写,不过兔子写的都是实测当天比较容易上分的,要给上分的难易度排个序,现在版本能用的阵容很多,但要是说条件比较简单,好打环境,容易苟分的还是铁骑天使,主要原因就是因为DNF你们有没有因为一个技能而去玩一个职业?好吧,我承认我是因为黄金大狮子才去玩的男气功!其实知墨我玩游戏是一个不折不扣的外观党,我经常搜索的关键词就是XX游戏什么职业最华丽,所以在DNF中我经常会因为一个华丽的技能去玩某个看见对面出了黄忠你们会选哪个?来自万年单排玩家的推荐选择亚瑟关羽墨子吕布。首选,自然是关羽一个操作难度为8的秀操作战士,相信这是非常多玩家的信仰膜拜对象,当然也是王者峡谷里众多射手法师玩家的噩梦。经历了几个赛季炉石传说,有哪些被砍一刀后,直接被废掉的卡组?1奴隶战战犹记得朝神三秒速算过墙斩杀手牌术,在战歌指挥官削弱后直接消失。这并不是战歌指挥官第一次削弱。早期战歌指挥官为所有其他随从获得冲锋,当时战士思路是卖血,然后上战歌和超低费熔EDGRNGKTKZ下路只论对线,谁更强?我是游戏直播大史官,专注游戏领域。在目前的lol职业联赛中,各大赛区的春季赛已经进行到中段了,每支队伍都在为季后赛的名额努力,那么EDGRNGKTKZ这几支以下路为核心的队伍,到底灭霸可以诅咒死侍永远不死,为什么不诅咒自己或者自己的手下不死?就算他有这个能力他也不会使用的永生和无敌都是极其寂寞的当一个人知道自己无敌和永生的时候就没有了生存的激情和斗志特别是灭霸这样的人如果不打仗生命对他毫无意义而且还是永生的寂寞无聊再一
云顶之弈运营技巧大揭秘,空城流只能倒数,学会他一定吃鸡关于运气重要还是运营重要的争议在游戏中已经持续了很长一段时间,关于这件事情的争议从来没有落下过帷幕,不管是运气还是运营技术都是游戏中很重要的一点,因为运气是决定了下限,而运营技术则云顶之弈君命已决,佛耶戈价值凸显,1V9不是梦想每个版本或者是每次更新都企图在所有的英雄之中去寻找到一个版本之子来进行运营或者是上分,因为拿到一个版本之子那么你有大概率的可能性将会赢得比赛,如果没有拿到版本之子的话不一定代表失败东风雪铁龙凡尔赛C5X现已开启交付,车主天津车展新厂喜提凡尔赛价格就要一步到位,势要将法式真诚给客户。9月29日,带着满满诚意的凡尔赛C5X来到天津车展举办区域上市会,不止于轿车的领潮设计,再加上14。37万元起售的诚意定价和超凡大礼,再掀车吃好睡好玩好!小鹏P5助现代人解锁高质量人类生活现代人3大养生法则每天睡够7小时晚上8点后不进食注重心理健康。然而事实却是,第一条我就不及格,作为一个每天加班到深夜的人,想要保证充足的睡眠很难,难道养生之路还没开始就结束了?还好详解长城汽车智慧线控底盘五大特质,其它车企我慕了如果不想变成老古董,就要学会跟着时代脉动。汽车行业就是如此,国内汽车行业的进步有目共睹,从不被信任到如今国货崛起,这中间攻克了太多的难题,尤其是汽车里最重要的三大件,国内车企都是花公路火箭,不信极限,东风风神全新AX7马赫版完成专业性能首测东风风神全新AX7马赫版于中国敦煌火星营地,完成了专业性能首测。这场在特殊的雅丹地貌进行的挑战之旅,体验到了东风全新马赫动力的澎湃动力,并首次领略全新AX7马赫版这一军工科技SUV圣索非亚大教堂的特点介绍建筑风格和笔画装饰历史背景特点介绍圣索非亚大教堂圣索菲亚大教堂坐落在蓝色清真寺对面。在1453年以前,一直是拜占庭帝国的主教堂,此后被土耳其人占领,改建成为清真寺。拜占庭建筑最光辉的代表是君士坦丁堡的圣索菲12。49万起,明锐Pro上市,不吹不黑,说说优缺点上汽斯柯达车型不少,但是说真正能打的可能还真的只能算明锐了。5月17日明锐家族全新车型明锐Pro正式上市,售价为12。49万15。79万元,对于这款车相信大家还是存在一定疑惑的,作英菲尼迪凭借怎样的创想诠释豪华美感提到豪华品牌,可能还是会有很多人会首先想起奔驰宝马这样销量比较亮眼的品牌,但是如果说起豪华品牌里比较独特的存在,英菲尼迪就算是其中的一个。为什么说它是最独特的存在之一?是因为英菲尼弹车试驾林肯冒险家,要什么车机互联?国产林肯自有其道虽然林肯是美系豪华车的代表,而且也有总统座驾的加持,说实话自从林肯回归中国市场以来它的存在感并不强。各款车型销量并不特别理想,但自从去年林肯首款国产车型冒险家上市之后,林肯开始了逆不到17万起,东风标致全新4008全新5008上海车展上市今年上海车展,不少新车上市,在众多新车中,小编比较关心法系车。为什么?众所周知,法系车这几年过得并不好,新车也是不多,对于喜欢法系车的人来说无疑非常遗憾。不过今年,法系车可能要大展