PostgreSQL之分区表(partitioning)

更新时间：2016年11月28日 22:25:18 投稿：mdxy-dxy

通过合理的设计，可以将选择一定的规则，将大表切分多个不重不漏的子表，这就是传说中的partitioning。比如，我们可以按时间切分，每天一张子表，比如我们可以按照某其他字段分割，总之了就是化整为零，提高查询的效能

PostgreSQL有一项非常有用的功能，分区表，或者partitioning。当某个TABLE的记录非常的多，千万甚至更多的时候，我们其实需要将他分割成子表。一个庞大的TABLE，就像水果仓库杂乱无章地堆放着无数的苹果桃子和桔子，查找不方便，性能降低，比较合理的做法是将仓库分成三个子区域，分表放苹果桃子和桔子。一张大表就变成了三个小表的集合。

通过合理的设计，可以将选择一定的规则，将大表切分多个不重不漏的子表，这就是传说中的partitioning。比如，我们可以按时间切分，每天一张子表，比如我们可以按照某其他字段分割，总之了就是化整为零，提高查询的效能。

怎么实现这个分区表的功能呢？
   1 建立大表。
   2 创建分区继承
   3 定义Rule或者Trigger？

下面根据一个简单的例子，描述这个过程。我们将学生按照低于60分和不低于60分切分成两张子表。

1 建立大表

CREATE TABLE student (student_id bigserial, name varchar(32), score smallint)

2 创建分区继承。

CREATE TABLE student_qualified (CHECK (score >= 60 )) INHERITS (student) ;
CREATE TABLE student_nqualified (CHECK (score < 60)) INHERITS (student) ;

创建了两个分区表，student_qualified和student_nqualified，继承了大表student的一切字段，同时设定了约束,即CHECK条件。

3 定义Rule或者Trigger。

虽然我们定义了CHECK条件，但是往student插入数据时，PostgreSQL并不能根据score是否低于60插入的正确的子表，原因是，你并没有定义这种规则，来告诉数据这么做。我们需要定义Rule或者Trigger，将数据插入到正确的分区表。
先看下Rule的定义：

CREATE OR REPLACE RULE insert_student_qualified 
AS ON INSERT TO student 
    WHERE score >= 60
    DO INSTEAD
    INSERT INTO student_qualified VALUES(NEW.*);

CREATE OR REPLACE RULE insert_student_nqualified 
AS ON INSERT TO student 
    WHERE score < 60
    DO INSTEAD
    INSERT INTO student_nqualified VALUES(NEW.*);

这两个Rule告诉了PostgreSQL，当往总表插数据的时候，如果是score< 60,则插入student_nqualified,如果score>=60,则插入student_qualified.注意了，这个分割一定要不重不漏，如果我们不小心将>=60条件的“=”丢掉，等于60分的记录将会录入大表student，不在任何一个分区表中。
我们插入一些记录：

INSERT INTO student (name,score) VALUES('Jim',77);
INSERT INTO student (name,score) VALUES('Frank',56);
INSERT INTO student (name,score) VALUES('Bean',88);
INSERT INTO student (name,score) VALUES('John',47);
INSERT INTO student (name,score) VALUES('Albert','87');
INSERT INTO student (name,score) VALUES('Joey','60');

我们看下数据分布情况，是否分布到了正确的的分区表：

SELECT p.relname,c.tableoid,c.* 
FROM student c, pg_class p
WHERE c.tableoid = p.oid

输出如下：

我们看到，虽然我们插入的是大表，但是数据却存在了对应的分区子表。符合我们的期望。同时还不影响查询。

Rule是一个分流的办法，还有TRIGGER也能做到让正确的数据流向正确的分区子表。
首先我们定义个function。

CREATE OR REPLACE FUNCTION student_insert_trigger()
RETURNS TRIGGER AS 
$$
BEGIN
   IF(NEW.score >= 60) THEN
     INSERT INTO student_qualified VALUES (NEW.*);
   ELSE 
     INSERT INTO student_nqualified VALUES (NEW.*);
   END IF;
   RETURN NULL;
END;
$$
LANGUAGE plpgsql ;

然后定义TRIGGER，当插入到student之前，就会触发trigger：

CREATE TRIGGER insert_student 
  BEFORE INSERT ON student
  FOR EACH row
  EXECUTE PROCEDURE student_insert_trigger() ;

我们首先通过删除TABLE student，测试下trigger方式。

DROP TABLE STUDENT CASCADE

CREATE TABLE student (student_id bigserial, name varchar(32), score smallint) ;
CREATE TABLE student_qualified (CHECK (score >= 60 )) INHERITS (student) ;
CREATE TABLE student_nqualified (CHECK (score < 60)) INHERITS (student) ;

然后执行定义FUNCTION和定义TRIGGER的语句。就可以查看了。
为了确认我们的触发器的确触发了，我们打开存储过程的统计开关：
在postgresql.conf中，找到track_functions,改成all

track_functions = all

插入之前先看下function student_insert_trigger的统计信息：

执行插入：

INSERT INTO student (name,score) VALUES('Jim',77);
INSERT INTO student (name,score) VALUES('Frank',56);
INSERT INTO student (name,score) VALUES('Bean',88);
INSERT INTO student (name,score) VALUES('John',47);
INSERT INTO student (name,score) VALUES('Albert','87');
INSERT INTO student (name,score) VALUES('Joey','60');

插入后，看下function student_insert_trigger的统计信息

我们看到trigger触发了6次。
执行下查询：

SELECT p.relname,c.tableoid,c.* 
FROM student c, pg_class p
WHERE c.tableoid = p.oid

输出如下：

参考文献

1 PostgreSQL document

您可能感兴趣的文章:

PostgreSQL教程(九)：事物隔离介绍
这篇文章主要介绍了PostgreSQL教程(九)：事物隔离介绍,本文主要针对读已提交和可串行化事物隔离级别进行说明和比较,需要的朋友可以参考下
2015-05-05
PostgreSQL中json数据类型详解
json数据也可以被存储为text，但是与text数据类型相比，JSON 数据类型的优势在于能强制要求每个被存储的值符合 JSON 规则，这篇文章主要介绍了PostgreSQL中json数据类型,需要的朋友可以参考下
2023-04-04
postgresql 中的COALESCE()函数使用小技巧
这篇文章主要介绍了postgresql 中的COALESCE()函数使用小技巧，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
PostgreSQL中常用的时间日期脚本使用教程
PostgreSQL是一款简介而又性能强大的数据库应用程序,其在日期时间数据方面所支持的功能也都非常给力,下面就来看一下PostgreSQL中常用的日期时间脚本使用教程.
2016-05-05
PostgreSQL 自动Vacuum配置方式
这篇文章主要介绍了PostgreSQL 自动Vacuum配置方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
postgresql修改完端口后直接psql连接数据库报错的解决
这篇文章主要介绍了postgresql修改完端口后直接psql连接数据库报错的解决，具有很好的参考价值，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
Ruoyi从mysql切换到postgresql的几个踩坑实战
最近由于工作的原因,需要将Ruoyi从mysql切换到postgresql,所以这篇文章主要给大家介绍了关于Ruoyi从mysql切换到postgresql的几个踩坑实战,需要的朋友可以参考下
2023-02-02
Ubuntu中卸载Postgresql出错的解决方法
这篇文章主要给大家介绍了关于在Ubuntu中卸载Postgresql出错的解决方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧。
2017-09-09
pgpool复制和负载均衡操作
这篇文章主要介绍了pgpool复制和负载均衡操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
对postgresql日期和时间的比较
文章介绍了在数据库中处理日期和时间类型时的一些注意事项,包括如何将字符串转换为日期或时间类型,以及在比较时自动转换的情况,作者建议在使用数据库时,根据具体情况进行适当的类型转换,以避免潜在的错误
2025-01-01

PostgreSQL之分区表(partitioning)

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具