PostgreSQL中rank()窗口函数实用指南与示例

更新时间：2025年07月11日 11:03:59 作者：梦想画家

在数据分析和数据库管理中,经常需要对数据进行排名操作,PostgreSQL提供了强大的窗口函数rank(),可以方便地对结果集中的行进行排名,本文将详细介绍rank()函数的使用方法,并通过多个实用示例展示其在不同场景下的应用,需要的朋友可以参考下

一、rank()函数简介

rank()是一个窗口函数，用于计算结果集中每一行的排名。它的基本语法如下：

rank() OVER ([PARTITION BY partition_expression] ORDER BY order_expression)

PARTITION BY：可选子句，用于将结果集划分为多个分区，排名在每个分区内独立计算。
ORDER BY：指定排名的顺序依据。

特点：

相同值的行会获得相同的排名。
下一个排名会跳过相同值的数量。例如，如果有两个第一名，下一个排名是第三名。

二、基础示例：部门内员工薪资排名

假设有一个employees表，包含员工姓名、部门和薪资信息。我们希望计算每个部门内员工的薪资排名。

示例数据

首先，创建示例数据：

WITH sample_data AS (
    SELECT * FROM (
        VALUES 
            ('Alice', 'Sales', 50000),
            ('Bob', 'Marketing', 55000),
            ('Charlie', 'Sales', 52000),
            ('David', 'IT', 60000),
            ('Eve', 'Marketing', 55000),
            ('Frank', 'IT', 62000)
    ) AS t(employee_name, department, salary)
)

排名查询

使用rank()函数按部门分区，按薪资降序排名：

SELECT 
    employee_name, 
    department, 
    salary, 
    RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dept_salary_rank
FROM 
    sample_data
ORDER BY 
    department, dept_salary_rank;

结果：

employee_name	department	salary	dept_salary_rank
Frank	IT	62000	1
David	IT	60000	2
Bob	Marketing	55000	1
Eve	Marketing	55000	1
Charlie	Sales	52000	1
Alice	Sales	50000	2

解释：

在IT部门，Frank薪资最高，排名为1；David次之，排名为2。
在Marketing部门，Bob和Eve薪资相同，均排名为1。
在Sales部门，Charlie薪资最高，排名为1；Alice次之，排名为2。

三、高级应用示例

1. 每组Top N记录

场景：找出每个类别中最贵的两个产品。

示例数据：

WITH products AS (
    SELECT * FROM (
        VALUES 
            (1, 'A', 100),
            (2, 'A', 80),
            (3, 'B', 200),
            (4, 'B', 180),
            (5, 'B', 150),
            (6, 'C', 120)
    ) AS t(product_id, category, price)
)

查询：

SELECT * 
FROM (
    SELECT 
        product_id, 
        category, 
        price, 
        RANK() OVER (PARTITION BY category ORDER BY price DESC) AS rank
    FROM 
        products
) ranked
WHERE rank <= 2;

结果：

product_id	category	price	rank
1	A	100	1
2	A	80	2
3	B	200	1
4	B	180	2
6	C	120	1

解释：

每个类别中，价格最高的前两个产品被筛选出来。

2. 百分位数计算

场景：计算每个学生的成绩百分位。

示例数据：

WITH scores AS (
    SELECT * FROM (
        VALUES 
            ('Student 1', 85),
            ('Student 2', 92),
            ('Student 3', 78),
            ('Student 4', 90),
            ('Student 5', 88)
    ) AS t(student, score)
)

查询：

SELECT 
    student, 
    score, 
    RANK() OVER (ORDER BY score) AS rank,
    ROUND(100.0 * RANK() OVER (ORDER BY score) / (SELECT COUNT(*) FROM scores), 2) AS percentile
FROM 
    scores;

结果：

student	score	rank	percentile
Student 3	78	1	20.00
Student 1	85	2	40.00
Student 5	88	3	60.00
Student 4	90	4	80.00
Student 2	92	5	100.00

解释：

百分位数通过排名除以总记录数并乘以100计算得出。

四、rank()与其他窗口函数的比较

PostgreSQL提供了多个窗口函数用于排名，各有特点：

函数	描述
rank()	相同值的行获得相同排名，下一个排名跳过相同值的数量。
dense_rank()	相同值的行获得相同排名，下一个排名不跳过，保持连续。
row_number()	每行分配唯一的序号，不考虑相同值，即使值相同也会分配不同序号。

示例：rank() vs dense_rank()

示例数据：

WITH scores AS (
    SELECT * FROM (
        VALUES 
            ('Player 1', 100),
            ('Player 2', 95),
            ('Player 3', 95),
            ('Player 4', 90)
    ) AS t(player, score)
)

查询：

SELECT 
    player, 
    score, 
    RANK() OVER (ORDER BY score DESC) AS rank,
    DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank
FROM 
    scores;

结果：

player	score	rank	dense_rank
Player 1	100	1	1
Player 2	95	2	2
Player 3	95	2	2
Player 4	90	4	3

解释：

rank()在遇到相同分数时跳过了排名3。
dense_rank()在遇到相同分数时不跳过排名，保持连续。

示例：row_number()

场景：为每日的销售记录分配唯一序号，按销售金额降序排列。

示例数据：

WITH sales AS (
    SELECT 
        DATE '2023-01-01' AS sale_date, 
        1000 AS amount
    UNION ALL
    SELECT 
        DATE '2023-01-01', 
        1500
    UNION ALL
    SELECT 
        DATE '2023-01-02', 
        1200
    UNION ALL
    SELECT 
        DATE '2023-01-02', 
        1200
)

查询：

SELECT 
    sale_date, 
    amount, 
    ROW_NUMBER() OVER (PARTITION BY sale_date ORDER BY amount DESC) AS row_num
FROM 
    sales;

结果：

sale_date	amount	row_num
2023-01-01	1500	1
2023-01-01	1000	2
2023-01-02	1200	1
2023-01-02	1200	2

解释：

即使同一天有相同的销售金额，row_number()也会为每条记录分配唯一的序号。

五、性能优化建议

使用窗口函数如rank()时，可能会对查询性能产生影响，尤其是在处理大数据集时。以下是一些优化建议：

使用PARTITION BY合理分区：将数据划分为较小的分区，可以减少每个窗口函数计算的数据量。
指定ORDER BY明确排序：确保ORDER BY子句明确，避免全表排序带来的性能开销。
创建适当的索引：在ORDER BY和PARTITION BY涉及的列上创建索引，可以加快排序和分区操作。
限制结果集：如果只需要前N条记录，结合WHERE rank <= N可以减少计算量。

六、总结

PostgreSQL的rank()窗口函数是一个强大的工具，适用于各种排名需求，如部门内薪资排名、每组Top N记录、百分位数计算等。通过合理使用rank()及其相关函数（如dense_rank()和row_number()），可以高效地处理复杂的数据分析任务。

关键点回顾：

rank()函数为相同值的行分配相同的排名，并跳过后续排名。
结合PARTITION BY和ORDER BY，可以实现多层次的排名需求。
与其他窗口函数（如dense_rank()和row_number()）相比，rank()在处理并列排名时有独特的行为。
通过优化查询和索引，可以提升窗口函数的性能表现。

希望本文的示例和解释能帮助你在实际项目中更好地应用rank()函数，提升数据处理的效率和准确性！

到此这篇关于PostgreSQL中rank()窗口函数实用指南与示例的文章就介绍到这了,更多相关PostgreSQL rank()窗口函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

PostgreSQL中的NULL处理实现
PostgreSQL中的NULL值处理功能丰富,可以帮助开发者更好地管理和查询数据,合理地使用NULL值可以提高查询效率,下面就来详细的介绍一下NULL的处理,感兴趣的可以了解一下
2026-03-03
Postgresql中null值和空字符串举例详解
在使用 PostgreSql时,实际场景中会出现某个字段为空或空字符串,下面这篇文章主要给大家介绍了关于Postgresql中null值和空字符串的相关资料,需要的朋友可以参考下
2024-02-02
PostgreSQL数据目录迁移的全过程
生产环境中随着PostgreSQL数据库表数据的不断产生,数据库目录会不断增长,当磁盘空间不足时会有将PostgreSQL数据库数据目录迁移到其他目录的需求,下面详细介绍目录迁移过程,需要的朋友可以参考下
2024-04-04
postgresql synchronous_commit参数的用法介绍
这篇文章主要介绍了postgresql synchronous_commit参数的用法介绍，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-12-12
postgresql 数据库与TimescaleDB 时序库 join 在一起
这篇文章主要介绍了postgresql 数据库与TimescaleDB 时序库 join 在一起,需要的朋友可以参考下
2020-12-12
PostgreSQL+Pgpool实现HA主备切换的操作
这篇文章主要介绍了PostgreSQL+Pgpool实现HA主备切换操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-12-12
postgresql 中的COALESCE()函数使用小技巧
这篇文章主要介绍了postgresql 中的COALESCE()函数使用小技巧，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
PostgreSQL之连接失败的问题及解决
这篇文章主要介绍了PostgreSQL之连接失败的问题及解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-05-05
PostgreSQL 实现查询表字段信息SQL脚本
这篇文章主要介绍了PostgreSQL 实现查询表字段信息SQL脚本，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
PostgreSQL主从流复制的完整部署指南
数据库高可用这件事,做与不做,差别在于：做了一切正常时可能觉得多余,但出问题的时候你会庆幸它还在,PostgreSQL从9.0版本开始原生支持流复制机制,本文将摒弃空泛理论,以CentOS/Ubuntu环境下的PostgreSQL 14为例,手把手带你完成从零搭建、配置调优到故障演练的完整流程
2026-05-05