使用窗口函数可实现分组内TOP N查询,如通过ROW_NUMBER()按部门分区、薪资降序分配行号,再筛选行号小于等于N的记录,确保每组取前N条完整信息。
在 SQL 中实现分组查询的 TOP N 排名,通常是指:在每个分组内按某个字段排序后,取出前 N 条记录。比如“每个部门工资最高的 3 名员工”。这类问题不能直接用 GROUP BY + LIMIT 解决,因为那样只能得到整体分组聚合值,无法保留完整行信息。
正确做法是使用窗口函数,尤其是 ROW_NUMBER()、RANK() 或 DENSE_RANK(),结合子查询或 CTE 实现。
1. 使用 ROW_NUMBER() 窗口函数
这是最常用的方法,确保每条记录有唯一排名,适合严格取前 N 条(不并列)。
示例:查询每个部门薪资最高的 2 名员工
SELECT dept_id, emp_name, salary, rn FROM ( SELECT dept_id, emp_name, salary, ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY salary DESC) AS rn FROM employees ) t WHERE rn <= 2;
说明:
- PARTITION BY dept_id:按部门分组
- ORDER BY salary DESC:组内按薪资降序排列
- ROW_NUMBER():为每行分配唯一序号
- 外层筛选 rn
2. 处理并列情况:RANK() vs DENSE_RANK()
如果希望并列成绩共享排名(如两个第一),可用 RANK() 或 DENSE_RANK()。
RANK():跳跃排名(如 1,1,3)
DENSE_RANK():连续排名(如 1,1,2)
示例:允许并列第一,但最多返回 3 条记录
SELECT * FROM ( SELECT category, product, sales, RANK() OVER (PARTITION BY category ORDER BY sales DESC) AS rk FROM sales_data ) t WHERE rk <= 3;
3. 兼容老版本数据库(无窗口函数)
对于 MySQL 5.7 或更早版本,可使用相关子查询模拟排名。
示例:每个类别销量前 2 的产品
SELECT s1.category, s1.product, s1.sales FROM sales_data s1 WHERE ( SELECT COUNT(*) FROM sales_data s2 WHERE s2.category = s1.category AND s2.sales > s1.sales ) < 2 ORDER BY category, sales DESC;
逻辑:统计组内比当前记录销量高的记录数,小于 N 表示在前 N 名内。
4. 性能优化建议
- 确保排序字段有索引,如 (dept_id, salary)
- 大数据量时,窗口函数通常比自连接或子查询更快
- 避免在大表上频繁执行全表扫描的 TOP N 查询
基本上就这些。核心思路是利用窗口函数在组内打排名标记,再通过外层过滤拿到所需行。方法灵活,适用于各类分组排名场景。