范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

分布式商城项目07分布式唯一ID实战

  1 背景
  在电商业务系统中,对ID生成的系统的可用性要求极高,如果生成系统不稳定,大量依赖ID生成系统,比如订单生成等关键动作都无法完成。一般情况下,我们使用数据库自增主键作为数据ID,但是在大量数据的情况下,尤其是在分库分表之后,这样就会出现ID大量重复,难以满足业务的需求,此时一个能够生成全局唯一ID的系统是非常必要的。概括下来,那业务系统对ID号的要求有哪些呢?
  全局唯一性:不能出现重复的ID号,既然是唯一标识,这是最基本的要求。
  趋势递增、单调递增:保证下一个ID一定大于上一个ID。
  信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,竞对可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。
  2 常见的分布式
  2.1 UUID
  UUID(Universally Unique Identifier)的标准型式包含32个16进制数字,以连字号分为五段,形式为8-4-4-4-12的36个字符,示例:550e8400-e29b-41d4-a716-446655440000,到目前为止业界一共有5种方式生成UUID,详情见IETF发布的UUID规范 A Universally Unique IDentifier (UUID) URN Namespace。
  优点:
  性能非常高:本地生成,没有网络消耗。
  缺点:
  不易于存储:UUID太长,16字节128位,通常以36长度的字符串表示,很多场景不适用。
  信息不安全:基于MAC地址生成UUID的算法可能会造成MAC地址泄露,这个漏洞曾被用于寻找梅丽莎病毒的制作者位置。
  ID作为主键时在特定的环境会存在一些问题,比如做DB主键的场景下,UUID就非常不适用:
  2.2 雪花算法及其衍生
  这种方案大致来说是一种以划分命名空间(UUID也算,由于比较常见,所以单独分析)来生成ID的一种算法,Snowflake 是 Twitter 开源的分布式 ID 生成算法。Snowflake 把64-bit分别划分成多段,分开来标示机器、时间等,比如在snowflake中的64-bit分别表示如下图所示:
  第 0 位: 符号位(标识正负),始终为 0,没有用,不用管。
  第 1~41 位 :一共 41 位,用来表示时间戳,单位是毫秒,可以支撑 2 ^41 毫秒(约 69 年)
  第 42~52 位 :一共 10 位,一般来说,前 5 位表示机房 ID,后 5 位表示机器 ID(实际项目中可以根据实际情况调整),这样就可以区分不同集群/机房的节点,这样就可以表示32个IDC,每个IDC下可以有32台机器。
  第 53~64 位 :一共 12 位,用来表示序列号。 序列号为自增值,代表单台机器每毫秒能够产生的最大 ID 数(2^12 = 4096),也就是说单台机器每毫秒最多可以生成 4096 个 唯一 ID。
  理论上snowflake方案的QPS约为409.6w/s,这种分配方式可以保证在任何一个IDC的任何一台机器在任意毫秒内生成的ID都是不同的。
  Snowflake 优缺点是:
  优点:
  毫秒数在高位,自增序列在低位,整个ID都是趋势递增的。
  不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的。
  可以根据自身业务特性分配bit位,非常灵活。
  缺点:
  强依赖机器时钟,如果机器上时钟回拨,会导致发号重复或者服务会处于不可用状态。
  2.3 Mysql 数据库
  数据库方案的优缺点如下:
  优点:
  非常简单,利用现有数据库系统的功能实现,成本小,有DBA专业维护。ID号单调自增,存储消耗空间小。
  缺点:
  支持的并发量不大、存在数据库单点问题(可以使用数据库集群解决,不过增加了复杂度)、ID 没有具体业务含义、安全问题(比如根据订单 ID 的递增规律就能推算出每天的订单量 )、每次获取 ID 都要访问一次数据库(增加了对数据库的压力,获取速度也慢)
  2.4 Redis
  通过 Redis 的 incr 命令即可实现对 id 原子顺序递增。
  为了提高可用性和并发,我们可以使用 Redis Cluster。
  除了高可用和并发之外,我们知道 Redis 基于内存,我们需要持久化数据,避免重启机器或者机器故障后数据丢失。很明显,Redis方案性能很好并且生成的 ID 是有序递增的。
  不过,我们也知道,即使Redis 开启了持久化,不管是快照(snapshotting,RDB)、只追加文件(append-only file, AOF)还是 RDB 和 AOF 的混合持久化依然存在着丢失数据的可能,那就意味着产生的ID存在着重复的概率。
  2.5 分布式ID微服务
  从上面的分析可以看出,每种方案都各有优劣,在我们的商城系统中则基于美团的Leaf实现了自己的分布式ID微服务。我们先来看看美团Leaf方案。
  Leaf这个名字是来自德国哲学家、数学家莱布尼茨的一句话: There are no two identical leaves in the world("世界上没有两片相同的树叶")
  Leaf分别在MySQL和雪花上做了相应的优化,实现了Leaf-segment和Leaf-snowflake方案。
  2.5.1 Leaf-segment数据库方案
  Leaf-segment方案,在使用数据库的方案上,做了如下改变:
  原MySQL方案每次获取ID都得读写一次数据库,造成数据库压力大。改为批量获取,每次获取一个segment(step决定大小)号段的值。用完之后再去数据库获取新的号段,可以大大的减轻数据库的压力。
  各个业务不同的发号需求用biz_tag字段来区分,每个biz-tag的ID获取相互隔离,互不影响。如果以后有性能需求需要对数据库扩容,不需要上述描述的复杂的扩容操作,只需要对biz_tag分库分表就行。
  数据库表设计如下:
  重要字段说明:biz_tag用来区分业务,max_id表示该biz_tag目前所被分配的ID号段的最大值,step表示每次分配的号段长度。原来获取ID每次都需要写数据库,现在只需要把step设置得足够大,比如1000。那么只有当1000个号被消耗完了之后才会去重新读写一次数据库。读写数据库的频率从1减小到了1/step。
  例如现在有3台机器,每台机器各取1000个,很明显在第一台Leaf机器上是1~1000的号段,当这个号段用完时,会去加载另一个长度为step=1000的号段,假设另外两台号段都没有更新,这个时候第一台机器新加载的号段就应该是3001~4000。同时数据库对应的biz_tag这条数据的max_id会从3000被更新成4000,更新号段的SQL语句如下:
  Begin
  UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
  SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
  Commit
  这种模式有以下优缺点:
  优点:
  Leaf服务可以很方便的线性扩展,性能完全能够支撑大多数业务场景。
  ID号码是趋势递增的8byte的64位数字,满足上述数据库存储的主键要求。
  容灾性高:Leaf服务内部有号段缓存,即使DB宕机,短时间内Leaf仍能正常对外提供服务。
  可以自定义max_id的大小,非常方便业务从原有的ID方式上迁移过来。
  缺点:
  ID号码不够随机,能够泄露发号数量的信息,不太安全。
  TP999数据波动大,当号段使用完之后还是会在获取新号段时在更新数据库的I/O依然会存在着等待,tg999数据会出现偶尔的尖刺。
  DB宕机会造成整个系统不可用。
  对于第二个缺点,Leaf-segment做了一些优化,简单的说就是:
  Leaf 取号段的时机是在号段消耗完的时候进行的,也就意味着号段临界点的ID下发时间取决于下一次从DB取回号段的时间,并且在这期间进来的请求也会因为DB号段没有取回来,导致线程阻塞。如果请求DB的网络和DB的性能稳定,这种情况对系统的影响是不大的,但是假如取DB的时候网络发生抖动,或者DB发生慢查询就会导致整个系统的响应时间变慢。
  为此,希望DB取号段的过程能够做到无阻塞,不需要在DB取号段的时候阻塞请求线程,即当号段消费到某个点时就异步的把下一个号段加载到内存中。而不需要等到号段用尽的时候才去更新号段。这样做就可以很大程度上的降低系统的TP999指标。
  采用双buffer的方式,Leaf服务内部有两个号段缓存区segment。当前号段已下发10%时,如果下一个号段未更新,则另启一个更新线程去更新下一个号段。当前号段全部下发完后,如果下个号段准备好了则切换到下个号段为当前segment接着下发,循环往复。
  通常推荐segment长度设置为服务高峰期发号QPS的600倍(10分钟),这样即使DB宕机,Leaf仍能持续发号10-20分钟不受影响。
  每次请求来临时都会判断下个号段的状态,从而更新此号段,所以偶尔的网络抖动不会影响下个号段的更新。
  2.5.2 Leaf-snowflake方案
  Leaf-segment方案可以生成趋势递增的ID,同时ID号是可计算的,不适用于订单ID生成场景,比如竞对在两天中午12点分别下单,通过订单id号相减就能大致计算出公司一天的订单量,这个是不能忍受的。面对这一问题,美团提供了 Leaf-snowflake方案。
  Leaf-snowflake方案完全沿用snowflake方案的bit位设计,即是"1+41+10+12"的方式组装ID号。对于workerID的分配,当服务集群数量较小的情况下,完全可以手动配置。Leaf服务规模较大,动手配置成本太高。所以使用Zookeeper持久顺序节点的特性自动对snowflake节点配置wokerID。Leaf-snowflake是按照下面几个步骤启动的:
  启动Leaf-snowflake服务,连接Zookeeper,在leaf_forever父节点下检查自己是否已经注册过(是否有该顺序子节点)。
  如果有注册过直接取回自己的workerID(zk顺序节点生成的int类型ID号),启动服务。
  如果没有注册过,就在该父节点下面创建一个持久顺序节点,创建成功后取回顺序号当做自己的workerID号,启动服务。
  除了每次会去ZK拿数据以外,也会在本机文件系统上缓存一个workerID文件。当ZooKeeper出现问题,恰好机器出现问题需要重启时,能保证服务能够正常启动。这样做到了对三方组件的弱依赖。
  2.5.3 美团Leaf现状
  Leaf在美团点评公司内部服务包含金融、支付交易、餐饮、外卖、酒店旅游、猫眼电影等众多业务线。目前Leaf的性能在4C8G的机器上QPS能压测到近5万/s,TP999 1ms,已经能够满足大部分的业务的需求。每天提供亿数量级的调用量。
  3 分布式ID实战
  从上面的分析可以看到,生成全局唯一ID的系统对于我们的项目来说是必须的,从诸多因素考虑,我们选用了美团的Leaf并根据项目的实际情况做了裁剪和改造。
  首先,在我们的整个的商品系统中并没有安装Zookeeper而且也不考虑竞对,所以在ymbmall-unqid中完全去除了有关Leaf-snowflake的部分,从美团Leaf和我们的代码比较即可看出:
  其次,在美团Leaf的实现中,可以看到对外提供ID的方法
  很明显,一次只能提供一个ID,但是仔细考察商城系统的业务需求,比如订单,我们知道一个订单往往分为两个部分,订单的基本信息和订单详情,订单详情往往包含该订单的产品列表,在保存时我们往往也会用两张表来保存,一是订单表,二是订单详情表。订单表的ID很好说,每次从唯一ID服务取一个ID即可,但是订单详情表呢?我们会一次性插入一条订单记录和多条订单详情记录,如果对于订单详情记录的ID每次都从唯一ID服务取,这个无疑会对性能有影响,解决办法有两个:
  1、订单详情记录的ID不保证全局唯一,依然使用数据库的自增主键;
  2、订单详情记录的ID需要全局唯一,但并不每次从唯一ID服务,而是在生成订单时,一次性从唯一ID服务获得。
  在我们的商城系统中,我们选择了第二种方式,很自然就需要对原来的美团Leaf进行改造:
  可以看到,我们新增了一个批量获得唯一ID的方法,并限定每次可以获得ID的最大数量为5000个。
  我们的ymbmall-unqid本身是个无状态的服务,可以很方便的进行服务集群,以高伸缩性来应对服务的高可用、性能上的需求。

锡安变成真胖虎,目测超过300斤,现在退役也是亿万富豪还在大学联赛时就已经家喻户晓,知名度更是位列巨星行列,放眼整个NBA,也只有詹姆斯和杜兰特这种这种级别能和他在关注度上一拼高下,本以为他能够带领球队走出深渊,成为下一个天王巨星,如17。1秒绝命21!保罗逆天3投让全场狂呼MVP,37岁老汉2110太稳了北京时间12月7日,NBA常规赛结束了一场焦点大战,之前刚刚险胜金州勇士队的马刺,并没有能够连赢西部两强,最终他们客场惜败给太阳,而且本场保罗再次送出逆天表演。太阳现在仍然处于残阵女排传来好消息!张常宁手术成功,郎平教练或将再次回归前言朱婷手腕伤势严重,朗平的卸任,似乎都表示着中国女排要下坡路了,但最近关于中国女排的消息都是比较好的,比如张常宁的手术非常成功,而朗平教练或许会再次回归到教练的岗位当中,大家也对正式离队!北京首钢老臣告别CBA赛场曾帮助球队拿到总冠军在秦晓雯成为北京首钢负责人之后,曾经表示要在三年内让球队重返争冠行列,为此他们引进了杰克逊汉密尔顿林书豪尤度等大牌外援,以及范子铭李慕豪等优秀球员,然而四个赛季过去了,北京首钢一次基建能源爆发,中国能建太阳能中国电建谁是龙头大哥?最近基建新能源等不断发酵,不时波动一番,我们在K线上也能捕捉到启动的迹象,加之新能源赛道不断加强,我们认为相关的板块概念等还有持续的可能。当然这个结合K线分析是更好的,那我们来看看看到的太多成挑战,让全球科学家在华排起长队,中国天眼有多牛?现代航天学和火箭理论的奠基人,苏联科学家康斯坦丁齐奥尔科夫斯基曾说过,地球是人类的摇篮,但是人类不能永远生活在摇篮里。尽管进入21世纪以后,世界各国在航天探索方面取得了长足的发展,大喜过望!辽宁猎人重返职业联赛,多名辽宁球员加盟志在冲冠辽宁猎人队曾是目前这支辽宁队的前身,而猎人队在八九十年代当中为辽宁获得了非常多的荣誉,他们多次获得全国冠军,联赛冠军,亚洲俱乐部冠军,全国运动会的冠军等等吧,可以说辽宁猎人队也是辽5金加1金!全红婵迎新主管教练,来头还不小,被誉为跳水女皇近期关于跳水国家队传来一则重磅消息,东京奥运会女子跳水神童全红婵将迎来一位主管教练,这人大家都非常熟悉,就是曾经的跳水女皇陈若琳!虽然两人岁数相差一代,但同样作为跳水项目上的王者,要击败全部中国选手?伊藤美诚放狠话,却被40被吊打累瘫在球桌伊藤美诚太嚣张在东京奥运会上当众评价许昕被她吓到不料下一秒就被孙颖莎好好地上了一课孙颖莎一开场就显示出舍我其谁的霸气以113拿下第一局这让伊藤美诚无可奈何只能撇嘴第二局伊藤美诚一上包文婧晒一家三口游玩照,包贝尔腿长遭调侃,女儿饺子可爱受欢迎幸福的一家三口!12月6日,包贝尔的老婆包文婧晒出了一组一家三口前往北京环球影城游玩时的照片,一家三口的合照幸福甜美,引来了无数粉丝关注,羡慕不已的同时也不忘调侃这幸福的一家三口。中国女排主攻线,李盈莹坠入太快。吴梦洁强势崛起中国女排联赛第一阶段比赛打完,技术统计也随支出炉。赛季前被人寄予厚望的李盈莹无缘得分榜前三十五,让人为她的坠入感到可惜。前几个赛季,李盈莹狂刷数据,赛场上呼风唤雨。这赛随着个队对李
湖人5换2报价德罗赞被拒!勇士欲续约2大功臣,太阳不敌鹈鹕4连败头条创作挑战赛据NBA官方消息,前NBA总冠军成员,79岁的著名教练保罗塞拉斯离世,作为詹姆斯职业生涯的首任主帅,塞拉斯曾帮助彼时尚且年幼的詹皇更快的适应NBA节奏。据悉,儿子斯蒂日本首富柳井正做不到这些,你就不可能成为成功的经营者近年来ZaraHM等快时尚品牌颓势渐显,优衣库却逆势而上,连续几年净利润增速达到两位数。做到这一点,优衣库创始人柳井正功不可没,外界评价他,全世界卖衣服的人很多,但只有他卖成了日本世界杯(20)半决赛前瞻法国阿根廷会师决赛,摩克功亏一篑赛事回顾摩洛哥对阵葡萄牙一战,摩洛哥继续摆大巴,防守阵型很好,由攻转守落位很快,这也是他能跻身四强的法宝,进攻办法不多,打的比较简单葡萄牙输球有点裁判和运气成分,但关键还是自己进攻一个三线小城市,竟然出过200多个冠军,这可真不是凡尔赛!最近一段时间,河北保定上了各大头条热搜,好不容易出名了,竟然是因为疫情,很不幸的是,笔者也中招了,感冒发烧咳嗽,不得不居家自我隔离,幸好有世界杯,满足了我这个伪体育迷的一点点爱好。世界冠军DRX的主教练将于2023年来到LCS加盟FlyQuest世界冠军队DRX的主教练Ssong转战北美LCS经过了低潮的2022,北美英雄联盟LCS的一些战队将雄心勃勃地运筹即将来到的2023新一年。其中FlyQuest是LCS变化巨大的战LPL世界级选手求职图火了,解说王多多站台,这么好却没人要前言S12赛季的比赛已经全部结束了,相信绝大多数的玩家都关注了最近一段时间的转会期,lpl赛区的各大战队阵容已经基本成型,排名靠前的战队都找到了合适的选手。而那些在顶流战队打过比赛中国女孩王子今勇夺斯巴达世锦赛冠军像做梦一样,我真的是世界第一了吗?冲过终点的王子今难掩激动地说。在2022斯巴达勇士儿童世锦赛上,11岁的中国女孩王子今以27分27秒的成绩在距离终点线仅20米的障碍完成逆转,夺得别只知道沙宣海飞丝了,想要头发顺滑,试试这款国货洗发水吧别只知道沙宣海飞丝了,想要头发顺滑试试这款国货洗发水吧你每次去超市必买的东西是什么?吃的喝的还是用的?相信很多姐妹去超市采购都跟小编一样,喜欢屯一下日用品,尤其是像洗发水这种一直会真正懂成分的人,会怎么护肤?毕业后,我们对视黄醇神经酰胺烟酰胺玻色因虾青素阿魏酸二裂酵母依克多因麦角硫因等反人类名称如数家珍我们的化学老师怎么也想不到,在我们离开校园后,知识储备的巅峰,竟是通过梳妆台上的瓶瓶巴雷特布伦森伤退和兰德尔被驱逐后,大家做好了防守今天尼克斯以11299战胜国王。赛后尼克斯前锋RJ巴雷特接受了记者的采访。第四节比赛中,后卫杰伦布伦森遭遇脚踝扭伤,随后下场。对此巴雷特说显然,失去队里的两位重要成员(注兰德尔被驱6人被禁赛!涉嫌以赌球为目的操纵比赛结果据中国台球协会网站消息,中国台球协会近日发布关于停止梁文博等球员国内台球比赛资格的处罚决定指出,自2022年12月11日起,停止梁文博李行鲁宁赵剑波白朗宁和常冰玉所有国内台球比赛资