范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

面试官为何Redis使用跳表而非红黑树实现SortedSet?

  跳表由William Pugh发明,他在论文《Skip lists: a probabilistic alternative to balanced trees》中详细介绍了跳表的数据结构和插入删除等操作,论文是这么介绍跳表的:
  Skip lists are a data structure that can be used in place of balanced trees.Skip lists use probabilistic balancing rather than strictly enforced balancing and as a result the algorithms for insertion and deletion in skip lists are much simpler and significantly faster than equivalent algorithms for balanced trees.
  也就是说,跳表可以用来替代红黑树,使用概率均衡技术,使得插入、删除操作更简单、更快。先来看论文里的一张图:
  观察上图
  a:已排好序的链表,查找一个结点最多需要比较N个结点。
  b:每隔2个结点增加一个指针,指向该结点间距为2的后续结点,那么查找一个结点最多需要比较ceil(N/2)+1个结点。
  c,每隔4个结点增加一个指针,指向该结点间距为4的后续结点,那么查找一个结点最多需要比较ceil(N/4)+1个结点。
  若每第2^i 个结点都有一个指向间距为 2^i的后续结点的指针,这样不断增加指针,比较次数会降为log(N)。这样的话,搜索会很快,但插入和删除会很困难。
  一个拥有k个指针的结点称为一个k层结点(level k node)。按照上面的逻辑,50%的结点为1层,25%的结点为2层,12.5%的结点为3层…如果每个结点的层数随机选取,但仍服从这样的分布呢(上图e,对比上图d)?
  使一个k层结点的第i个指针指向第i层的下一个结点,而不是它后面的第2^(i-1)个结点,那么结点的插入和删除只需要原地修改操作;一个结点的层数,是在它被插入的时候随机选取的,并且永不改变。因为这样的数据结构是基于链表的,并且额外的指针会跳过中间结点,所以作者称之为跳表(Skip Lists)。
  二分查找底层依赖数组随机访问的特性,所以只能用数组实现。若数据存储在链表,就没法用二分搜索了?
  其实只需稍微改造下链表,就能支持类似"二分"的搜索算法,即跳表(Skip list),支持快速的新增、删除、搜索操作。
  Redis中的有序集合(Sorted Set)就是用跳表实现的。我们知道红黑树也能实现快速的插入、删除和查找操作。那Redis 为何不选择红黑树来实现呢?
  ◆  跳表的意义究竟在于何处?
  单链表即使存储的数据有序,若搜索某数据,也只能从头到尾遍历,搜索效率很低,平均时间复杂度是O(n)。
  追求极致的程序员就开始想了,那这该如何提高链表结构的搜索效率呢?
  若如下图,对链表建立一级"索引",每两个结点提取一个结点到上一级,把抽出来的那级叫作索引或索引层。图中的down表示down指针,指向下一级结点。
  比如要搜索16:  先遍历索引层,当遍历到索引层的13时,发现下一个结点是17,说明目标结点位于这俩结点中间  然后通过down指针,下降到原始链表层,继续遍历
  此时只需再遍历2个结点,即可找到16!
  原先单链表结构需遍历10个结点,现在只需遍历7个结点即可。可见,加一层索引,所需遍历的结点个数就减少了,搜索效率提升。
  若再加层索引,搜索效率是不是更高?于是每两个结点再抽出一个结点到第二级索引。现在搜索16,只需遍历6个结点了!
  这里数据量不大,可能你也没感觉到搜索效率ROI高吗。
  那数据量就变大一点,现有一64结点链表,给它建立五级的索引。
  原来没有索引时,单链表搜索62需遍历62个结点!
  现在呢?只需遍历11个!所以你现在能体会到了,当链表长度n很大时,建立索引后,搜索性能显著提升。
  这种有多级索引的,可以提高查询效率的链表就是最近火遍面试圈的跳表。
  作为严谨的程序员,我们又开始好奇了
  ◆跳表的搜索时间复杂度
  我们都知道单链表搜索时间复杂度O(n),那如此快的跳表呢?
  若链表有n个结点,会有多少级索引呢?假设每两个结点抽出一个结点作为上级索引,则:  第一级索引结点个数是n/2  第二级n/4  第三级n/8  …  第k级就是 n/(2^k)
  假设索引有h级,最高级索引有2个结点,可得:  n/(2h) = 2
  所以:  h = log2n-1
  若包含原始链表这一层,整个跳表的高度就是log2 n。我们在跳表中查询某个数据的时候,如果每一层都要遍历m个结点,那在跳表中查询一个数据的时间复杂度就是O(m*logn)。
  那这个m的值是多少呢?按照前面这种索引结构,我们每一级索引都最多只需要遍历3个结点,也就是说m=3,为什么是3呢?我来解释一下。
  假设我们要查找的数据是x,在第k级索引中,我们遍历到y结点之后,发现x大于y,小于后面的结点z,所以我们通过y的down指针,从第k级索引下降到第k-1级索引。在第k-1级索引中,y和z之间只有3个结点(包含y和z),所以,我们在K-1级索引中最多只需要遍历3个结点,依次类推,每一级索引都最多只需要遍历3个结点。
  通过上面的分析,我们得到m=3,所以在跳表中查询任意数据的时间复杂度就是O(logn)。这个查找的时间复杂度跟二分查找是一样的。换句话说,我们其实是基于单链表实现了二分查找,是不是很神奇?不过,天下没有免费的午餐,这种查询效率的提升,前提是建立了很多级索引,也就是我们在第6节讲过的空间换时间的设计思路。 ◆ 跳表是不是很费内存?
  由于跳表要存储多级索引,势必比单链表消耗更多存储空间。那到底是多少呢?
  若原始链表大小为n:  第一级索引大约有n/2个结点  第二级索引大约有n/4个结点  …  最后一级2个结点
  多级结点数的总和就是:  n/2+n/4+n/8…+8+4+2=n-2
  所以空间复杂度是O(n)。这个量还是挺大的,能否再稍微降低索引占用的内存空间呢?
  若每三五个结点才抽取一个到上级索引呢?
  第一级索引需要大约n/3个结点  第二级索引需要大约n/9个结点  每往上一级,索引结点个数都除以3  n/3+n/9+n/27+…+9+3+1=n/2
  尽管空间复杂度还是O(n),但比上面的每两个结点抽一个结点的索引构建方法,要减少了一半的索引结点存储空间。
  我们大可不必过分在意索引占用的额外空间,实际开发中,原始链表中存储的有可能是很大的对象,而索引结点只需存储关键值和几个指针,无需存储对象,所以当对象比索引结点大很多时,那索引占用的额外空间可忽略。 ◆ 插入和删除的时间复杂度◆ 插入
  在跳表中插入一个数据,只需O(logn)时间复杂度。
  单链表中,一旦定位好要插入的位置,插入的时间复杂度是O(1)。但这里为了保证原始链表中数据的有序性,要先找到插入位置,所以这个过程中的查找操作比较耗时。
  单纯的单链表,需遍历每个结点以找到插入的位置。但跳表搜索某结点的的时间复杂度是O(logn),所以搜索某数据应插入的位置的时间复杂度也是O(logn)。
  ◆ 删除
  如果这个结点在索引中也有出现,除了要删除原始链表的结点,还要删除索引中的。
  因为单链表删除操作需拿到要删除结点的前驱结点,然后通过指针完成删除。所以查找要删除结点时,一定要获取前驱结点。若是双向链表,就没这个问题了。
  ◆ 跳表索引动态更新
  当不停往跳表插入数据时,若不更新索引,就可能出现某2个索引结点之间数据非常多。极端情况下,跳表还会退化成单链表。
  作为一种动态数据结构,我们需要某种手段来维护索引与原始链表大小之间的平衡,也就是说,如果链表中结点多了,索引结点就相应地增加一些,避免复杂度退化,以及查找、插入、删除操作性能下降。
  像红黑树、AVL树这样的平衡二叉树通过左右旋保持左右子树的大小平衡,而跳表是通过随机函数维护前面提到的"平衡性"。
  往跳表插入数据时,可以选择同时将这个数据插入到部分索引层中。
  那如何选择加入哪些索引层呢?
  通过一个随机函数决定将这个结点插入到哪几级索引中,比如随机函数生成了值K,那就把这个结点添加到第一级到第K级这K级索引中。
  为何Redis要用跳表来实现有序集合,而不是红黑树?
  Redis中的有序集合支持的核心操作主要支持:  插入一个数据  删除一个数据  查找一个数据  迭代输出有序序列
  以上操作,红黑树也能完成,时间复杂度跟跳表一样。  按照区间查找数据
  红黑树的效率低于跳表。跳表可以做到 O(logn) 定位区间的起点,然后在原始链表顺序往后遍历即可。
  除了性能,还有其它原因:  代码实现比红黑树好懂、好写多了,因为简单就代表可读性好,不易出错  跳表更灵活,可通过改变索引构建策略,有效平衡执行效率和内存消耗  ◆ 跳表的代码实现(Java 版)◆ 数据结构定义
  表中的元素使用结点来表示,结点的层数在它被插入时随机计算决定(与表中已有结点数目无关)。
  一个i层的结点有i个前向指针(java中使用结点对象数组forward来表示),索引为从1到i。用MaxLevel来记录跳表的最大层数。
  跳表的层数为当前所有结点中的最大层数(如果list为空,则层数为1)。
  列表头header拥有从1到MaxLevel的前向指针: public class SkipList {      // 最高层数     private final int MAX_LEVEL;     // 当前层数     private int listLevel;     // 表头     private SkipListNode listHead;     // 表尾     private SkipListNode NIL;     // 生成randomLevel用到的概率值     private final double P;     // 论文里给出的最佳概率值     private static final double OPTIMAL_P = 0.25;          public SkipList() {         // 0.25, 15         this(OPTIMAL_P, (int)Math.ceil(Math.log(Integer.MAX_VALUE) / Math.log(1 / OPTIMAL_P)) - 1);     }      public SkipList(double probability, int maxLevel) {         P = probability;         MAX_LEVEL = maxLevel;          listLevel = 1;         listHead = new SkipListNode(Integer.MIN_VALUE, null, maxLevel);         NIL = new SkipListNode(Integer.MAX_VALUE, null, maxLevel);         for (int i = listHead.forward.length - 1; i >= 0; i--) {             listHead.forward[i] = NIL;         }     }      // 内部类     class SkipListNode {         int key;         T value;         SkipListNode[] forward;                  public SkipListNode(int key, T value, int level) {             this.key = key;             this.value = value;             this.forward = new SkipListNode[level];         }     } }◆ 搜索算法
  按key搜索,找到返回该key对应的value,未找到则返回null。
  通过遍历forward数组来需找特定的searchKey。假设skip list的key按照从小到大的顺序排列,那么从跳表的当前最高层listLevel开始寻找searchKey。在某一层找到一个非小于searchKey的结点后,跳到下一层继续找,直到最底层为止。那么根据最后搜索停止位置的下一个结点,就可以判断searchKey在不在跳表中。 在跳表中找8的过程:
  ◆插入和删除算法
  都是通过查找与连接(search and splice)
  维护一个update数组,在搜索结束之后,update[i]保存的是待插入/删除结点在第i层的左侧结点。
  ◆插入
  若key不存在,则插入该key与对应的value;若key存在,则更新value。
  如果待插入的结点的层数高于跳表的当前层数listLevel,则更新listLevel。
  选择待插入结点的层数randomLevel:
  randomLevel只依赖于跳表的最高层数和概率值p。
  另一种实现方法为,如果生成的randomLevel大于当前跳表的层数listLevel,那么将randomLevel设置为listLevel+1,这样方便以后的查找,在工程上是可以接受的,但同时也破坏了算法的随机性。
  ◆删除
  删除特定的key与对应的value。如果待删除的结点为跳表中层数最高的结点,那么删除之后,要更新listLevel。  public class SkipList {      // 最高层数     private final int MAX_LEVEL;     // 当前层数     private int listLevel;     // 表头     private SkipListNode listHead;     // 表尾     private SkipListNode NIL;     // 生成randomLevel用到的概率值     private final double P;     // 论文里给出的最佳概率值     private static final double OPTIMAL_P = 0.25;      public SkipList() {         // 0.25, 15         this(OPTIMAL_P, (int)Math.ceil(Math.log(Integer.MAX_VALUE) / Math.log(1 / OPTIMAL_P)) - 1);     }      public SkipList(double probability, int maxLevel) {         P = probability;         MAX_LEVEL = maxLevel;          listLevel = 1;         listHead = new SkipListNode(Integer.MIN_VALUE, null, maxLevel);         NIL = new SkipListNode(Integer.MAX_VALUE, null, maxLevel);         for (int i = listHead.forward.length - 1; i >= 0; i--) {             listHead.forward[i] = NIL;         }     }      // 内部类     class SkipListNode {         int key;         T value;         SkipListNode[] forward;                  public SkipListNode(int key, T value, int level) {             this.key = key;             this.value = value;             this.forward = new SkipListNode[level];         }     }      public T search(int searchKey) {         SkipListNode curNode = listHead;          for (int i = listLevel; i > 0; i--) {             while (curNode.forward[i].key < searchKey) {                 curNode = curNode.forward[i];             }         }          if (curNode.key == searchKey) {             return curNode.value;         } else {             return null;         }     }      public void insert(int searchKey, T newValue) {         SkipListNode[] update = new SkipListNode[MAX_LEVEL];         SkipListNode curNode = listHead;          for (int i = listLevel - 1; i >= 0; i--) {             while (curNode.forward[i].key < searchKey) {                 curNode = curNode.forward[i];             }             // curNode.key < searchKey <= curNode.forward[i].key             update[i] = curNode;         }          curNode = curNode.forward[0];          if (curNode.key == searchKey) {             curNode.value = newValue;         } else {             int lvl = randomLevel();              if (listLevel < lvl) {                 for (int i = listLevel; i < lvl; i++) {                     update[i] = listHead;                 }                 listLevel = lvl;             }              SkipListNode newNode = new SkipListNode(searchKey, newValue, lvl);              for (int i = 0; i < lvl; i++) {                 newNode.forward[i] = update[i].forward[i];                 update[i].forward[i] = newNode;             }         }     }      public void delete(int searchKey) {         SkipListNode[] update = new SkipListNode[MAX_LEVEL];         SkipListNode curNode = listHead;          for (int i = listLevel - 1; i >= 0; i--) {             while (curNode.forward[i].key < searchKey) {                 curNode = curNode.forward[i];             }             // curNode.key < searchKey <= curNode.forward[i].key             update[i] = curNode;         }          curNode = curNode.forward[0];          if (curNode.key == searchKey) {             for (int i = 0; i < listLevel; i++) {                 if (update[i].forward[i] != curNode) {                     break;                 }                 update[i].forward[i] = curNode.forward[i];             }              while (listLevel > 0 && listHead.forward[listLevel - 1] == NIL) {                 listLevel--;             }         }     }      private int randomLevel() {         int lvl = 1;         while (lvl < MAX_LEVEL && Math.random() < P) {             lvl++;         }         return lvl;     }      public void print() {     for (int i = listLevel - 1; i >= 0; i--) {             SkipListNode curNode = listHead.forward[i];             while (curNode != NIL) {                 System.out.print(curNode.key + "->");                 curNode = curNode.forward[i];             }             System.out.println("NIL");         }     }      public static void main(String[] args) {         SkipList sl = new SkipList();         sl.insert(20, 20);         sl.insert(5, 5);         sl.insert(10, 10);         sl.insert(1, 1);         sl.insert(100, 100);         sl.insert(80, 80);         sl.insert(60, 60);         sl.insert(30, 30);         sl.print();         System.out.println("---");         sl.delete(20);         sl.delete(100);         sl.print();     } }
  来源:https://www.toutiao.com/a7003231554520597000/

藏在装备之中的英雄核心武器,吕布是破军,铠皇却是这2件2100关注小木运气高,走路也能捡钱包大家都知道,在王者荣耀之中,每一个英雄几乎都有着属于自己的专属核心武器。比如吕布的核心武器是破军,因为这件装备可以大幅度提升他的真实伤害。而亚瑟的专属砸锅卖铁也要买的3个13888坦克,项羽上榜,榜首肉到没人性关注小木运气高,走路也能捡钱包大家都知道,在王者荣耀之中,坦克英雄的位置是非常重要的。如果我们队伍之中的坦克靠谱,那想赢得这场排位的几率就会非常大。因为一个真正强大的坦克英雄不但可王者荣耀用什么坦克最给力?萌新选廉颇,大神却选少有人用的他本文只代表个人观点前言大多数王者荣耀的玩家都认为坦克英雄是非常容易操作的,团战开始的时候,只要无脑直接向前冲就可以了。不过我认为坦克也并不是大家所想的那样简单,如果我们能选对英雄,射手最怕的3个坦克,刘禅居然上榜,自带破军的他是榜首本文只代表个人观点要问王者荣耀之中,射手最怕的坦克英雄有哪些?我想大多数人都会说是铠皇。因为铠皇的攻击力非常强大,他的被动有额外百分之五十的伤害!大招开启之后,还有200点的攻击加失传已久的亚瑟最狂出装,只需这2件装备,就能轻松吊打吕布典韦本文只代表个人观点大家都知道,亚瑟是王者荣耀之中公认的强势英雄。因为他不但有着坦克的肉度,而且本身攻击力也是非常爆炸的。最主要是他的三个技能都是以攻击为主,尤其一三技能还有着很强的替代吕布英雄出现,专治阿轲,一打三也没问题,上王者就用他本文只代表个人观点要说吕布绝对可以说是王者荣耀之中强大的英雄,因为他的综合能力非常强,本身不但有着百分之百的真实伤害,而且肉度也非常高,所以我们用吕布来打边路是非常靠谱的。但是他也S20第一射手,伽罗凉了,后羿不给力,鲁班没地位,他悄悄崛起本文只代表个人观点要问S20赛季的第一射手是谁?我想很多人都会说是伽罗或是后羿,再就是鲁班。因为这三个射手的热度非常高,别说是钻石局,就算是王者局也老是能看到他们的身影。咱们先说伽后羿攻速快,伽罗攻距远,都不如自带2件防装的他,移速比关羽快本文只代表个人观点前言要问S19赛季哪个射手最强?我想很多人都会说是后羿或是伽罗,因为这两个射手都有着很强的手段。咱们先说后羿,他的最大特点就是攻击速度快,如果我们铭文和出装都以吸LOL内瑟斯天赋出装那么怎样能玩好这个英雄呢沙漠死神内瑟斯是古代恕瑞玛的一名飞升者,他有着犬头人身,却有学识渊博,是恕瑞玛帝国智慧最高的人。在游戏中,内瑟斯是一名后期无敌的英雄,发育良好的内瑟斯可以在后期以一挡五。那么怎样能王者荣耀这三个纸老虎英雄,看着强,却很容易被克制王者荣耀中有很多有意思的英雄,他们的技能面板很好,但是却有很容易被克制的一面,今天我们就来看看王者荣耀当中的三只纸老虎吧。夏侯惇不但可以打出爆发性的伤害,而且还带有控制的技能,且回战舰之风袭来!来核聚变不容错过的内容核聚变线下游戏展是国内为数不多的纯粹的游戏展会,它以十分硬朗的硬核特质而受到广大玩家的欢迎和追捧。经过疫情和承办方的多方波折,核聚变线下游戏展在阔别我们两年之久后终于在昨天,于北京
火影忍者究极风暴4中文版火影忍者究极风暴4是由NamcoBandai发行的一款格斗游戏,以火影忍者动漫为故事蓝本,也是火影系列的最新作,不仅对画面和战斗火爆程度大幅度提升,还加入了混战地形破坏效果,在玩家影子战术将军之刃爱子的选择评测从上火到上头Mimimi做RTT游戏从不让人失望不得不说,影子战术将军之刃爱子的选择,更像是正作的新资料片,并且基本没有改动。在操作系统和可用人物上,影子战术将军之刃爱子的选择与正作影子战术将惊喜开箱!来战舰世界领福利了12月15日,战舰世界全球同步火热开启,玩家蜂拥而至参与此次活动,作为2021的重磅活动,全球同步给大家准备的福利着实不少,量大且精致。全新战舰像是S系航母,D系2线战列舰,造船厂王国保卫战10周年专题纪念视频公布为纪念王国保卫战发售10周年,IronhideGameStudio发布了一部记录游戏与工作室发展历程的视频。视频地址王国保卫战是一款塔防游戏,其开发商IronhideGameStuDota2互联网邀请赛落幕,黑豚战队逆袭夺冠,拿到了Tspirit剧本前段时间,Dota2圈的首届TheInternet互联网邀请赛正式落下帷幕,本次比赛结束后,也有很多人顺利出圈,包括赛事主办人Zard,扩大了Dota2游戏的影响力,让更多人发现了Dota2Longdd与老陈开启竞速模式,水友表示谢谢你,菠萝赛东哈喽大家好,这里是蜻蜓队长Zwj。随着第一届TheInternet互联网邀请赛的落幕,Dota圈也开始趋于平静了,就在互联网邀请赛落幕的同时,远古大神Longdd也是在小破站开启了C9选手在线学习韩语?只因队伍当中三位LCK选手,遭网友无情嘲讽以前LCK的选手在英雄联盟这款游戏的统治力,是非常强大的。从各大赛区LCK选手的占比,就可以看得出来。LCK在S4开始之后,向世界各大赛区输送人才,时至今日,每一年的S赛冠军都有L边路之猴桑杰露脸,50岁声音18岁的脸,直言哥的帅气你无法抵御王者荣耀已经进行到S25赛季了,这个赛季和之前相比还是有不小的变化,皮肤也是越出越多。很多玩家平时不仅仅是关注游戏本身,还比较喜欢看直播,主播和游戏也是相辅相成的。游戏主播分很多种EDG冠军皮肤正式公布,jiejie放弃皇子,准备冲击销量纪录前言S11赛季的比赛已经全部结束了,相信绝大多数的玩家都关注了最近一段时间的edg战队,作为世界总决赛的冠军,他们的整体人气热度是非常高的。冠军皮肤成为了所有玩家关注的焦点,夺冠之王者荣耀镜匿光追影者爆料登场,祈雪灵祝即将优化,吕布有好消息大家好,我是小欢,原创不易,切勿抄袭大家前几天不是还在奇怪王者荣耀没有什么大动作吗,这不就在最近,王者荣耀好事频频,多个皮肤好消息不断,除了有之前的马可波罗6元秒杀皮肤以外,马上镜KPL限定即将上线,不会玩镜不要紧,教你如何打崩她,对位就选铠大家好我是指尖,镜姐的kpl限定皮肤终于全面曝光,且即将上线,超低的价格诱惑力十足,然而镜的操作难度太高,以至于劝退了无数玩家,看到赛场上的镜乱秀轻松切后排,到了自己手上可能就像个