窗口函数是那些对分区或窗口的每一行进行操作的函数。这些函数为每条查询行产生结果,而聚合函数则将它们分组,并将结果归入单行。 窗口函数的基本语法: <窗口函数> OVER ( [ PARTITION BY <列清单> ] ORDER BY <排序用列清单> )排名窗口函数: RANK、DENSE_RANK、ROW_NUMBER 能够作为窗口函数的聚合函数:SUM、AVG、COUNT、MAX、MIN 非聚类窗口函数(可用于同比、环比等):LAG、LEAD PARTITION BY 按指定对象来分类。 ORDER BY 能够指定按照哪一列、何种顺序进行排序。 这篇主要是排名窗口函数的应用。 小智和他的小伙伴们 故事:来自真新镇的10岁天才少年小智,用他25年的学习经验夺得了世界冠军。今天他想在隔壁老木那里看看哪只杰尼龟和小火龙的攻击力最高。他简单的看了下数据,决定用SQL操作一番。 首先看下数据:SELECT * FROM pokemon_table; 排名窗口函数的应用: 对上述SQL进行拆分解释,先来看看OVER括号里的内容:PARTITION BY对pokemon列进行了分组,将小火龙和杰尼龟分为两大组;在分完组后,ORDER BY对attack列按降序排列,然后分别赋予排名。 接下来看看这几个排名的区别:RANK 函数:计算排序时,如果存在相同位次的记录,则会跳过之后的位次。 例如:有 3 条记录排在第 1 位时:1 位、1 位、1 位、4 位DENSE_RANK 函数:同样是计算排序,即使存在相同位次的记录,也不会跳过之后的位次。 例如:有 3 条记录排在第 1 位时:1 位、1 位、1 位、2 位......ROW_NUMBER 函数:赋予唯一的连续位次。 例如:有 3 条记录排在第 1 位时:1 位、2 位、3 位、4 位...... rank dense_rank row_number 这三个排序还是比较好记的:rank:正常排名,会跳位次dense_rank:dense单词是密集的意思,所以排名是紧靠的,不存在跳位次row_number:可以这么记,row是行的意思,每一个人必须单独占有一行,所以是1,2,3,4...... 另外需要知道的是,排序窗口函数的第一个括号是不需要填任何东西的,而第二个括号中PARTITION BY不是必须项,但是去掉的话,就是按整个表的数据进行处理,不会按组进行分类处理了 我们按的是攻击力降序排列,没有了partition by,所以是对整个数据进行排序 总结: <窗口函数> OVER ( [ PARTITION BY <列清单> ] ORDER BY <排序用列清单> )<窗口函数>填入RANK()、DENSE_RANK()、ROW_NUMBER() ,括号不需要填写任何东西 PARTITION BY <列清单>:列清单填入所需要的列(可以多个列),窗口函数会按填入的列进行分组,PARTITION BY不是必须项,去掉就是对整个数据进行处理ORDER BY <排序用列清单>:选定需要按哪一列的数据大小排序RANK(): 跳位次、 DENSE_RANK(): 密集排序、 ROW_NUMBER(): 1,2,3... 彩蛋:小智肯定不会只满足于攻击力高这一选项,毕竟是顶尖训练师,所以他接下来要做的事情便是找到综合实力最高的,平均实力最强的,数量最多的小精灵。