范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

一文详解缓存策略

  缓存是应对高并发场景下的一大神器,而如何设计好缓存模块并非直观想象的那么简单。本文聊一聊缓存模块设计过程中的那些事儿。涉及到的讨论有:
  缓存与数据库操作的非原子性引发的一致性问题 并发引发的一致性问题 写链路中是选择更新缓存还是删除缓存 主从延迟和延迟双删问题一、引入缓存--小试牛刀
  随着业务的发展,QPS有了一定的升高,对数据库造成的压力越来越大。这一阶段主要是希望通过加一层缓存,分担数据库的读请求压力1.1 方案一:全量缓存+定时更新
  方案示意图如下:
  写请求直接打到DB,不对缓存做更新读请求打到redis,缓存不设置过期时间,因此无需回源额外起定时任务将全量库存数据同步到redis中 A方式:查询mysql数据更新到redis B方式:监听binlog,启动时全量插入一遍缓存,而后根据binlog增量更新(中间件Canal)1.2 方案二:缓存设置过期时间
  方案示意图如下:
  写请求和方案一一样,直接打到DB,不对缓存做更新读请求先打到缓存 命中缓存,则获取值而后返回 未命中缓存,回源DB,查询到数据构建缓存,而后返回1.3 方案分析
  方案
  优点
  缺点
  方案一
  实现简单
  1. 缓存利用率低,冷数据会长期占用redis空间
  2. 同步数据:采用A方式需要全量扫库,高频更新
  会导致数据库压力大,且任务执行时间会决定DB
  和redis中数据不一致的时间;采用B方式更合理些,
  但也引入了 canal 外部依赖
  方案二
  缓存利用率高,通过设置过期时间
  冷数据自动过期清除
  1. 过期时间不好设置,一般依靠经验值会设计为秒级
  2. DB和redis之间的缓存不一致情况由过期时间决定,
  因此一般会存在秒级的不一致方案二中的一些坑
  简单来说需要考虑以下几个问题大量请求获取一个本不在 redis 也不在 DB 中的值,导致缓存穿透热key失效引发缓存击穿缓存击穿到重新构建缓存期间,请求相同key的请求继续回源DB,导致DB瞬时压力激增
  详细解决方案可以参考后端研发避坑指南-1.1 缓存设计如何选择
  方案之间的对比需要放在场景中分析,没有绝对的好与坏,只有适不适合方案一适合需要缓存的数据量不大、读远多于写的场景方案二适合数据量大,数据之间有冷热的区分
  另外,由于二者在写时都不会去操作缓存,因此在缓存和数据库的实时一致性方面都是比较差的(理论上都是秒级以上),对实时一致性要求比较高的场景不适合用这两种方案二、追求实时一致性
  上面提到的2种方案,在写请求时都没有去操作缓存,如果在写DB的同时主动去操作缓存,是不是会在实时一致性方面表现更好呢。简单分析下:如果写DB时更新缓存,那二者的时间差几乎就是写缓存所耗费的时间,约等于10ms如果写DB时删除缓存,下次读请求就会回源,理论上似乎没有一致性问题
  这样看,在写请求时操作缓存确实可以使得实时一致性至少从秒级提高到毫秒级
  但事情似乎没有这么简单
  当写请求从只写DB到需要写DB+写缓存时,我们需要考虑的点就变多了,总的来说需要考虑到:顺序问题:是先写DB还是先写缓存?并发问题:非原子性:第2步操作失败主从延迟问题:极端情况下主从延迟会达到秒级,这对方案设计和选择会有什么影响
  在回答是选删除还是选更新前,先按照以上三点分别剖析这两种方案,最后再来做比较(虽然缓存带过期时间是个比较好的实践,但下面讨论的方案中如没有特别说明都是没有过期时间的缓存)2.1 删除缓存先删除缓存,后更新数据库
  读写并发线程A要更新 X=2(原值 X=1)线程A先删除缓存线程B读缓存,发现不存在,准备回源线程B回源读取到 X=1,构建缓存 X=1并返回结果线程A更新数据库 X=2
  最终导致 DB 中的值是新值,缓存中的值是旧值,发生不一致
  写并发
  写并发并不会对写操作有影响,因为实际上底层数据库的更新还是串行的。影响可能是在写多的场景下,会导致缓存频繁删除,进而读请求频繁回源,对DB产生压力
  第2步失败
  删除缓存成功,更新数据库失败,此时请求同步返回失败。对于发起写请求的用户,会感知到失败,而后可以进行重试对于发起读请求的用户,仍然是正常使用服务先更新数据库,后删除缓存
  读写并发缓存中X不存在(可能是被写请求删除,也可能是过期自动删除),数据库中X=1线程B读取缓存,不存在,回源DB,获取到X=1线程A更新数据库 X=2线程A删除缓存(此时缓存本来也不存在)线程B将旧值写入缓存 X=1
  最终同样会导致缓存和DB中的值不一致
  写并发
  同上
  第2步失败
  更新数据库成功,删除缓存失败,假设请求返回失败对于发起写请求的用户,会感知到失败,而后可以进行重试对于发起读请求的用户,在写请求重试成功之前,会读取到旧值
  假设请求返回成功对于发起写请求的用户,认为是请求成功了,不会发起重试对于发起读请求的用户,在新的写请求到来并且删除缓存成功或者缓存自动过期之前,会读取到旧值分析
  从「并发」的角度
  不管顺序如何都有导致缓存和数据库不一致的可能,那到底该如何选呢?需要定性分析下这两种情况的可能性到底谁大谁小
  对于前者,写请求线程A的操作是2+5,两步写操作,读请求3+4两步读操作。通常写数据库时底层数据库会加锁,而读数据库不会加锁,因此理论上2+5的时间会大于3+4的时间;
  对于后者,读请求的操作是2+5,写请求是3+4,根据上面所说的"2步写请求的时间一般会大于2步读请求的时间",从这点来看,后者发生的可能性是要小于前者的。
  除此之后,后者还需要叠加另外两个条件线程B读取缓存时,缓存刚好失效读请求和写请求并发
  所以总体上,「先更新数据库后删除缓存」的方案出现缓存和数据库不一致的可能性更小
  从「第2步失败」的角度
  看起来是「先删除缓存再更新数据库」更胜一筹
  在实际生产环境中,更倾向于选择「先更新数据库,再删除缓存」的方案。对于该方案在「第2步失败」方面的短板,一般解决方案是:失败后多次重试(比如引导用户多次重试,或者配置失败自动重试请求)消息队列,异步重试。代码中在更新数据库成功之后向MQ生产一条消息,消费者消费时保证一定成功。订阅数据库Binlog日志:相较于消息队列的方式,与业务代码解耦,且避免了写消息队列失败的情况。大概原理就是伪装成数据库的 slave 获取到Binlog日志完美了吗?
  还有一种近乎无解的情况:主从延迟
  不管是用哪种方式,如果回源DB时,由于主从延迟导致查询到值本身就是旧值,那写入缓存的也必定是旧值了。这里是有解决方案的,就是缓存回源的时候强制读主库。但是一般都不会使用这种方案,原因是这会使得回源的读请求直接打到主库,风险非常大,另外本身用于承担查询请求的从库也就没有了其存在的意义
  还有一种解决方案:延迟双删。所谓的双删是:写请求中更新数据库+删除缓存后,再通过一条延时消息随后触发再次删除缓存。这样的目的是为了把读请求中在从库读出的数据清掉。但这个方案有个很大的问题,延迟时间如何设置?只能按照经验去设置
  所以,缓存和数据库之间的一致性是很难做到强一致的,只能是尽可能减小产生不一致的可能性和不一致状态的时间2.2 更新缓存
  同样采取刚刚的分析框架先更新缓存,后更新数据库
  读写并发线程A更新X=2(旧值X=1),先更新缓存,成功线程B读取缓存X=2线程A更新数据库X=2
  这么一看,好像没啥问题,此时仅仅只有读写并发确实没有问题,等会结合「第2步失败」一起看
  写并发线程A更新X=2(旧值X=1),先更新缓存,此时缓存X=2线程B更新X=3,更新缓存成功,此时缓存X=3线程B更新数据库,此时数据库X=3线程A更新数据库,此时数据库X=2
  最终导致缓存中的值是3,数据库中的值是2
  第2步失败
  更新缓存成功,更新数据库失败,此时请求同步返回失败。对于发起写请求的用户,会感知到失败,而后可以进行重试对于发起读请求的用户,读取到的数据是数据库中并不存在的数据,一旦缓存失效,读取到的仍然是旧值,对业务有影响先更新数据库,后更新缓存
  读写并发线程A更新X=2(旧值X=1),先更新数据库,此时数据库X=2线程B读取缓存X=1线程A更新缓存X=2
  最终的值是一致的,但是步骤2中读到的值与当时数据库中的值不一致
  写并发线程A更新X=2(旧值X=1),先更新数据库,此时数据库X=2线程B更新X=3,更新数据库,此时数据库X=3线程B更新缓存,此时缓存X=3线程A更新缓存,此时缓存X=2
  导致了不一致
  第2步失败
  更新数据库成功,更新缓存失败,假设请求返回失败对于发起写请求的用户,会感知到失败,而后可以进行重试对于发起读请求的用户,在写请求重试成功之前,会读取到旧值
  假设请求返回成功对于发起写请求的用户,认为是请求成功了,不会发起重试对于发起读请求的用户,在新的写请求到来并且更新缓存成功或者缓存自动过期之前,会读取到旧值分析
  从「并发」的角度:两种顺序都会导致不一致,且可能性是类似的(因为都是两步写操作),不一致的时间取决于缓存的过期时间
  从「第2步失败」的角度,相对于读到旧值,读到不存在的值更不可接受,因此从这点来看「先更新数据库,后更新缓存」的方案更好一些2.3 到底是删除还是更新?
  从尽可能保证缓存和数据库一致性的角度,选删除好一些。这也是业界比较推荐的一种方式,被称为Cache-Aside(旁路缓存)。流程如下:
  除此之外还需要考虑的点是:当缓存的值需要经过一系列的计算得到时,删除也比更新合适。删除使得缓存类似于一种懒加载的模式,有请求才会去构建缓存,可以节省计算资源
  但是笔者有了解到,某些大型互联网电商也有采用写请求时更新缓存的方式 。其给出的理由是:写时删除缓存,会导致C端读请求的集中回源(比如秒杀场景)会对DB造成很大的压力。值得一提的是,它们的方案中写时更新缓存是异步的,并且通过一些防抖设计减少了更新次数以降低缓存侧的写压力
  其实这也道出了删除缓存和更新缓存一个很大的区别:更新缓存可以最大程度的保证读请求能Hit cache,提高缓存命中率;而删除缓存实际上是依靠回源DB来保持数据的新鲜程度的。因此在一些特定场景下,如果回源DB的请求都足以打垮数据库时,是可以考虑使用更新缓存的方式的
  另一方面,删除缓存的方案在回源DB的场景下是可以做一些优化,以降低数据库的压力。比如golang中有Singleflight,可以在单机层面减少回源的请求(比如原本有100个请求同一行数据的请求,Singleflight会拦截后99个)三、缓存的各种读、写模式
  接下来会介绍四种缓存的读、写模式,分别对应读、写请求的策略。按读、写区分,理论上是可以两两组合3.1 Read-Through
  意为读穿透模式,它的流程和Cache-Aside中的读流程类似,不同点在于Read-through多了一个访问控制层,如下图
  优点是:上游只和访问控制层交互,并不关心下游是否有缓存以及是什么缓存策略,上游的业务层会更加简洁;同时对缓存层和持久化层交互的封装程度更高,更便于移植
  该模式适合的场景是:read-heavy
  当然这种方式会存在不一致的问题,在下面写模式中会有相应的策略3.2 Write-Through
  意为直写模式,如图:
  注意这里与 Cache-Aside 模式不同的是:是更新缓存而非删除缓存更新缓存在先,更新DB在后
  这种方式的优缺点在上面已经分析过了。该模式适合的场景是:写操作较多且对一致性要求比较高的场景。理论上 Read-Through 和Write-Though组合可以获得不错的缓存利用率和实时一致性,据说亚马逊的 DynamoDB Accelerator 就是采用了这两种模式3.3 Write-Around
  如果对一致性的要求较弱,可以选择在Cache-Aside读链路中增加缓存的过期时间,在写链路中仅仅更新数据库,不做任何的删除或更新缓存的操作。这其实就是第一部分中的方案二。这种方案实现简单,但缓存中的数据和数据库数据一致性较差3.4 Write-Behind/Write Back
  意为异步回写模式,它具有类似Write-Through的访问控制层,不同的是,该模式下的写链路,只更新缓存而不更新数据库,对于数据库的更新,则是通过批量异步更新的方式进行的,并且可以通过上面提到的防抖设计聚合更新请求,以减少对DB的实际写访问
  该模式下,写请求延迟较低,具有较好的系统吞吐。但缺点也很明显:缓存和数据库的一致性弱,数据库是落后于缓存的缓存负载大,若缓存宕机会造成数据丢失,因此需要重点考虑缓存的高可用部署
  因此该模式比较适合瞬时写操作的场景,比如电商领域的秒杀场景四、小结第一部分主要介绍了简单的应用缓存扛住读流量的方案,其主要的缺点是缓存与数据库的一致性较差第二部分的方案主要是为了追求实时一致性,因此在写链路上需要操作缓存,分析了"操作"应该选是删除还是更新。业界一般采用删除缓存的方式,同时使用相关组件(如Singleflight)解决重复的回源DB的读请求。但更新缓存也有具体的实践,二者需要根据具体业务场景、资源(数据库、缓存)等情况来选择「先更新数据库后删除缓存」优于「先删除缓存后更新数据库」,原因是后者在并发场景下缓存不一致发生的可能性更低,触发的条件更苛刻「第2步失败」场景下,一般需要失败重试,好的解决方式是订阅Binlog,消费者重试保证最终成功第三部分按读、写总结了缓存策略中常用的四种模式,以及其适合的场景,总结来说读多写少场景下:Cache-Aside+消费binlog异步重试比较适合,进一步其中讲述的Read-Through可以与Cache-Aside模式中的读链路做替换写多场景下,可以选择 Write-Through,但Write-Through在并发场景下缓存和数据库不一致的可能性会由于多个线程并发写而提高,因此使用该方案时需要对此有预期写多的极端场景,可以选择 Write-Behind 方案
  在笔者的工作中,一开始采用的方案是第一部分的方案二,即设置缓存时间,后续采用的是Cache-Aside的方案,并对回源请求引入了SingleFlight以保护DB参考文档
  developer.baidu.com/article/det…
  codeahoy.com/2017/08/11/… **最后** - 如果觉得有收获,三连支持下; - 文章若有错误,欢迎评论留言指出,也欢迎转载,转载请注明出处; - 个人vx:Echo-Ataraxia, 交流技术、面试、学习资料、帮助一线互联网大厂内推等 - 个人博客建设中:https://blog.echo-ataraxia.icu/ 复制代码

生活特别像层塔最快心的一次旅行,是刚去青岛出了火车站就到了栈桥。在去青岛前没有做攻略,想着走到哪算哪。果然没有打算的旅游会带给你惊喜。栈桥一座延伸到海里的层塔,看起来好像很热闹,被人围着拍照都找飞机上有4种隐藏服务,主动向空姐提才能享受到,看完涨知识随着交通行业的不断发展,现如今人们出门的交通工具也就变得越来越多了。对于经济实力较好的乘客们来说,多数的他们在出远门的时候,都会搭乘速度较快的飞机出行。(此处已添加小程序,请到今日60岁前,一定要去的20个古镇,既美又有烟火气,你准备好了吗?生命里总要有一段静谧的时光过一阵慢下来的日子好想带你去古镇小住几天!发呆沉思共享寂静偷得浮生半日闲心情半佛半神仙在在不老的时光里你能一直看着我微笑幽静的古镇里我们都能有一段静谧的时川西大环游(四)石墨公园第一次品尝沙棘果昨天我们一早从汶川县映秀镇出发,往四姑娘山,以为赶个早,然而一路堵车,到达目的地根本上不去了,连停车的地方都找不到。我们只好撤出往下一个景区赶,然而还没到达下景区,天都黑了。今日,讲好中国故事传播好中国声音来源人民网人民日报海报图片为电视纪录片摆脱贫困记住乡愁如果国宝会说话电视综艺节目典籍里的中国海报。图电视剧觉醒年代剧照。图电视剧跨过鸭绿江剧照。图电视剧功勋剧照。图电视剧埃博拉前线到底什么是雷电接口,这个接口有什么用?文小伊评科技首先我们要弄懂什么是雷电接口。其实雷电本质上和咱们常见的HDMI,DP等一样是一种传输协议的简称,全程英文名叫做Thunderbolt。请注意与其说他是一个接口倒不如说八位堂pro2蓝牙手柄评测游戏的最佳伴侣很多学生玩过游戏机的朋友,都很难进行再次选择回到触控的手机网络游戏上。手感很大程度上能够决定了游戏的体验感,一旦使用过游戏机,就会想为我们每一个游戏都配上手柄操控。现在,这个问题想C关于调用微信接口的代码之前公司下达了开发微信只一块的任务,然后我就去网上取了一番经,可是感觉对于我这种微信开发的新手来说,所需要的东西太多,太凌乱了,然后整个人就懵逼了。费了很长时间才将微信接口调用完成家长注意了!8个月宝宝充电线含嘴里取出时已冒烟接口烧出个洞身处电子时代,如今手机也成了大家日常生活中必不可少的一部分,大家平时手机都是怎么充电的呢?可能有些人会觉得我这个问题很傻,手机还能怎么充电,就是用充电器插在插头上充电啊。那么大家平经典与潮流碰撞的好声音,尊宝JamoRS3无线蓝牙音箱分享作为一个伪音乐爱好者,除了收集各种专辑,也少不了大大小小各种音频设备,手上有雅马哈,松下,山进几个牌子的音箱。最近又体验了一番尊宝JamoRS无线蓝牙音箱。Jamo尊宝RS3无线蓝升级换新装,更快更防水南卡骨传导PRO3蓝牙耳机体验南卡骨传导耳机的版本迭代的特别快,PRO2版本才推出没多久,PRO3版本火急火燎的就上市了,那么南卡骨传导PRO3有哪些提升呢?带着这个疑问,我来看看这款产品。开箱南卡骨传导PRO
有剧毒!在海边看到它,别碰立刻跑福建靠海去海边欣赏美景是很多市民的周末度假首选但需要注意的是如果在海滩见到这些颜色鲜艳形状特别的生物别碰,立刻跑3月24日晚一位市民在深圳大鹏西涌海滩欣赏海景时发现沙滩上有被海水冲海水提锂来了,是一门好生意?近日,全球首个海水淡化浓盐水提锂合作项目落地青岛,一度引发提锂概念股异动。3月初,青岛水务集团有限公司与礼思(上海)材料科技有限公司在青岛启动全球首个海水提锂工厂建设项目。青岛水务海边微风拂起,我在等风也在等你世界犹如大海,人生便是航船,不撞击礁石,就不会有浪花朵朵,荡漾的碧波,我想我们生存的意义,应该就在于这条航船与航线之间的距离吧。银色的沙滩,慵懒的阳光,在微风轻拂下,整个午后,就这如何选购胖大海现存古籍中,最早记载胖大海的是清代赵学敏所著本草纲目拾遗,胖大海本身是一种食物,但因其具有显著的药效,常被作为药食同源食物,用于辅助治疗慢性咽炎等咽喉疾病。胖大海味甘淡,性凉,归肺清洗花蛤时,最忌用盐和油,海边老渔民教你一招,花蛤疯狂吐泥沙大家好,欢迎来到美食格物。为什么饭店里炒的花甲那么好吃还没有一点腥味呢?其实做法非常简单,只要记住炒花甲的时候千万不要焯水,你也可以做出鲜味十足的花甲。买回的花甲倒入盆中给它挑选一十四五期间我国加速打造五大海上风电基地央视网消息十四五期间,我国规划了五大千万千瓦海上基地,各地出台的海上风电发展规划规模已达8000万千瓦,这将推动海上风电实现更高速发展。在山东半岛渤海湾海域,一台台风机正迎风旋转。山东首富950亿,日照首富820亿,烟台首富370亿,潍坊首富230亿山东省是中国华东地区的一个沿海省份,也是工业大省,工业基础雄厚,拥有41个工业大类,中国重要的工业基地和北方地区经济发展的战略支点山东也是我国经济第三大省,2022年山东GDP为8烟台公交明日开通杏花谷赏花定制专线,票价1元,接驳免费!记者于洋通讯员王柯然为进一步丰富乘公交游烟台文旅品牌内涵,方便市民到牟平区十里杏花谷景区赏花踏青,助力烟台旅游经济发展,3月26日,烟台公交开通1条杏花谷赏花定制专线和2条杏花谷接七夕会美食清明时节忆刀鱼今年正月十五后,又一次随老妻回乡。在望江楼酒店又尝到了久违的刀鱼。我最后一次吃刀鱼是在五年前,长江还未禁渔。那年清明前回老妻的家乡祭祖,打卡长江边上的合兴镇。好客的堂表兄们在临江的定了!4月2日阳信第三十四届梨花会开幕齐鲁网闪电新闻3月26日讯乡村好时节LETS购主题年滨州阳信第三十四届梨花会暨第十三届黄河三角洲民俗文化节将于4月2日至4日在阳信举办。此次梨花会的主题是花为媒盼您在缤纷之中赢未来魏县梨花开放香飘魏州千树万树梨花开,百年梨园迎客来。在魏县大宋梨园景区,万顷梨花陆续绽放,一树树的梨花竞相开放,朵朵洁白的梨花让这里成为新的网红打卡地,吸引了大批游客前来欣赏优美风光,感受田园乐趣。花