MySQL 8.0 新增SQL语法对窗口函数和CTE的支持 - 数据库编程

TOP

MySQL 8.0 新增SQL语法对窗口函数和CTE的支持(一)

2018-03-18 16:21:22 【大中小】浏览:148次

Tags：MySQL 8.0 新增 SQL 语法窗口函数 CTE 支持

　　尝试了一下MySQL 8.0的部分新特性。

　　在MSSQL和Oracle以及PostgreSQL都已经完整支持窗口函数的情况下，MySQL 8.0中也加入了窗口函数的功能，这一点实实在在方便了sql的编码，可以说是MySQL8.0的亮点之一。

　　对于窗口函数，比如row_number()，rank()，dense_rank()，NTILE()，PERCENT_RANK()等等，在MSSQL和Oracle以及PostgreSQL，使用的语法和表达的逻辑，基本上完全一致。

　　这一点，几个数据库厂商做的还是比较统一的，如果熟悉任何一种关系数据中的窗口函数（分析函数），在MySQL 8.0之后就放心的用吧。

　　通过一个case来体验一下窗口函数的方便性，熟悉MSSQL或者Oracle或者PostgreSQL的老司机就不用看了。

　　测试case，简单模拟一个订单表，字段分别是订单号，用户编号，金额，创建时间

drop table if exists order_info

create table order_info
(
order_id int primary key,
user_no varchar(10),
amount int,
create_date datetime
);

insert into order_info values (1,'u0001',100,'2018-1-1');
insert into order_info values (2,'u0001',300,'2018-1-2');
insert into order_info values (3,'u0001',300,'2018-1-2');
insert into order_info values (4,'u0001',800,'2018-1-10');
insert into order_info values (5,'u0001',900,'2018-1-20');

insert into order_info values (6,'u0002',500,'2018-1-5');
insert into order_info values (7,'u0002',600,'2018-1-6');
insert into order_info values (8,'u0002',300,'2018-1-10');
insert into order_info values (9,'u0002',800,'2018-1-16');
insert into order_info values (10,'u0002',800,'2018-1-22');

要求sql查询求每个用户的最新的一个订单。

传统的方式，尽量格式化的好读一点的情况下，说实话，这句sql咋一看有点莫名其妙，不知所以。

SELECT * FROM
(
SELECT
　　 IF(@y=a.user_no, @x:=@x+1, @x:=1) X ,
IF(@y=a.user_no, @y, @y:=a.user_no) Y,
a.*
FROM order_info a, (SELECT @x:=0, @y:=NULL) b
ORDER BY a.user_no, a.create_date desc
) a
WHERE X <= 1;

如下是执行结果，当然执行结果是可以满足需求的。

　　如果采用新的窗口函数的方法，
　　就是使用row_number()over(partition by user_no order by create_date desc) as row_num 给原始记录编一个号，
　　然后取第一个编号的数据，自然就是“用户的最新的一条订单”，实现逻辑上清晰了很多，代码也简洁，可读了很多。

select * from
(
select row_number()over(partition by user_no order by create_date desc) as row_num,
order_id,user_no,amount,create_date
from order_info
)t where row_num=1;

　　需要注意的是，MySQL中的使用窗口函数的时候，是不允许使用*的，必须显式指定每一个字段。

row_number()

　　(分组)排序编号，正如上面的例子， row_number()over(partition by user_no order by create_date desc) as row_num，按照用户分组，按照create_date排序，对已有数据生成一个编号。
　　当然也可以不分组，对整体进行排序。任何一个窗口函数，都可以分组统计或者不分组统计（也即可以不要partition by ***都可以，看你的需求了）

rank()

　　类似于 row_number()，也是排序功能，但是rank()有什么不一样？新的事物的出现必然是为了解决潜在的问题。
　　如果再往测试表中写入一条数据：insert into order_info values (11,'u0002',800,'2018-1-22');
　　对于测试表中的U002用户来说，有两条create_date完全一样的数据（假设有这样的数据），那么在row_number()编号的时候，这两条数据却被编了两个不同的号
　　理论上讲，这两条的数据的排名是并列最新的。因此rank()就是为了解决这个问题的，也即：排序条件一样的情况下，其编号也一样。

dense_rank()

　　dense_rank()的出现是为了解决rank()编号存在的问题的，
　　rank()编号的时候存在跳号的问题，如果有两个并列第1，那么下一个名次的编号就是3，结果就是没有编号为2的数据。
　　如果不想跳号，可以使用dense_rank()替代。

avg，sum等聚合函数在窗口函数中的的增强

　　可以在聚合函数中使用窗口功能，比如sum(amount)over(partition by user_no order by create_date) as sum_amont，达到一个累积计算sum的功能
　　这种需求在没有窗口函数的情况下，用纯sql写起来，也够蛋疼的了，就不举例了。

NTILE(N) 将数据按照某些排序分成N组

　　举个简单的例子，按照分数线的倒序排列，将学生成绩分成上中下3组，可以得到哪个程序数据上中下三个组中哪一部分，就可以使用NTILE(3) 来实现。这种需求倒是用的不是非常多。
　　如下还是使用上面的表，按照时间将user_no = 'u0002'的订单按照时间的纬度，划分为3组，看每一行数据数据哪一组。

first_value(column_name) and last_value(column_name)

　　first_value和last_value基本上见名知意了，就是取某一组数据，按照某种方式排序的，最早的和最新的某一个字段的值。
　　看结果体会一下。

nth_value(column_name,n)

　　从排序的第n行还是返回nth_value字段中的值，这个函数用的不多，要表达的这种逻辑，说实话，很难用语言表达出来，看个例子体会一下就行。

　　n = 3

　　n = 4

cume_dist

　　在某种排序条件下，小于等于

首页上一页 1 2 下一页尾页 1/2/2
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：使用explain优化sql	下一篇：Python导出MySQL数据库中表的建表..