postgresql实现对已有数据表分区处理的操作详解

 更新时间:2023年12月21日 08:28:10   作者:用户3919820697669  
这篇文章主要为大家详细介绍了postgresql实现对已有数据表分区处理的操作的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下

背景:业务初期创建的一张表,有 20 个字段,没有超长超大字段。随着系统运行,数据量来到了将近 1.3 亿行约 60GB。目前整体稳定,考虑到后续数据持续增长,打算先对表进行分区处理。考虑分区的主要因素是,这张表的数据主要是插入,和对最近插入数据的查询,后续会有少量针对该表的全量查询操作。

一、对已有数据进行备份

创建备份表并将所有的数据备份到 t_test_back 表里。这种方式备份,只会复制表结构和表数据,不会包含索引和约束。并且这种方式不会涉及到加锁等操作,整体执行很快,60GB 的数据大概在 5 分钟左右备份完成。

create table public.t_test_back as (select * from public.t_test);

二、删除原表

删除原表之前,记得先保留好建表语句,原表索引和约束,原建表语句如下:

CREATE TABLE public.t_test (
    id bigserial NOT NULL,
    column1 int8 NOT NULL,
    column2 varchar NOT NULL,
    column3 varchar NULL,
    create_time timestamptz NULL,
    CONSTRAINT t_test_pkey PRIMARY KEY (id)
);

CREATE INDEX column1_idx ON public.t_test USING btree (column1);
CREATE INDEX column2_idx ON public.t_test USING btree (column2);

删除原表直接使用 drop 语句:

drop table public.t_test;

我执行的时候,大概十分钟没有反应,最后查询检查 pg_stat_activity 视图,发现 public.t_test 还有 active sql 执行。

通过下面的方式,将在执行中的 sql 全部中断掉。

-- 找到当前表还在执行的查询
select pid, query, state from pg_stat_activity where state = 'state' and query like '%t_test%';
-- 可以取消查询
select pg_cancel_backend(pid);
-- 也可以强制中止会话
select pg_terminate_backend(pid);

将执行中的查询取消后,drop 操作很快完成,正常执行预估也是在 5 分钟左右能执行完成。

三、创建分区表

根据原表建表语句创建分区表,其中分区字段需要作为pk的一部分,我使用时间字段 create_timerange 分区:

CREATE TABLE public.t_test (
    id bigserial NOT NULL,
    column1 int8 NOT NULL,
    column2 varchar NOT NULL,
    column3 varchar NULL,
    create_time timestamptz NOT null DEFAULT CURRENT_TIMESTAMP,
    CONSTRAINT t_test_pkey PRIMARY KEY (id, create_time)
) partition by range(create_time);

我这里一年的数据量大概是 8 千万,我按照半年一个分区建表,最后有一个 DEFAULT 的分区表,用来存储分区以外的数据:

create table public.t_test_2022_02 partition of public.t_test for values from ('2022-06-01 00:00:00') to ('2022-12-31 23:59:59');

create table public.t_test_2023_01 partition of public.t_test for values from ('2023-01-01 00:00:00') to ('2023-06-30 23:59:59');
create table public.t_test_2023_02 partition of public.t_test for values from ('2023-07-01 00:00:00') to ('2023-12-31 23:59:59');

create table public.t_test_2024_01 partition of public.t_test for values from ('2024-01-01 00:00:00') to ('2024-06-30 23:59:59');
create table public.t_test_2024_02 partition of public.t_test for values from ('2024-07-01 00:00:00') to ('2024-12-31 23:59:59');

create table public.t_test_default partition of public.t_test DEFAULT;

我这里将原来的索引直接用在分区表的主表上:

CREATE INDEX column1_idx ON public.t_test USING btree (column1);
CREATE INDEX column2_idx ON public.t_test USING btree (column2);

由于我使用的 postgresqlserial 类型做 id 字段的自增序列,所以还需要将序列的最新值更新到比之前表的最大 id 还要大。防止主键冲突。

alter sequence public.t_test_id_seq restart 340000000;

四、数据恢复

由于我的表的数据主要使用的是增量数据,所以我把 id 最大的一条数据插入数据库表后,就可以恢复服务。 最后用 sql 将剩余的数据插入新表即可:

insert into public.t_test (select * from public.t_test_back);

到此这篇关于postgresql实现对已有数据表分区处理的操作详解的文章就介绍到这了,更多相关postgresql数据表分区处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Postgresql 动态统计某一列的某一值出现的次数实例

    Postgresql 动态统计某一列的某一值出现的次数实例

    这篇文章主要介绍了Postgresql 动态统计某一列的某一值出现的次数实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • 详解PostgreSQL 表分区与继承

    详解PostgreSQL 表分区与继承

    本文将深入剖析PostgreSQL表分区与继承的实现机理,结合最新版本(16版本)的特性演进,通过大量生产级代码示例,揭示如何设计高效的分区方案、优化分区查询性能,并巧妙运用继承特性构建灵活的数据模型,感兴趣的朋友一起看看吧
    2025-04-04
  • PostgreSQL设置时区、时间/日期函数汇总大全

    PostgreSQL设置时区、时间/日期函数汇总大全

    PostgreSQL是一款简介而又性能强大的数据库应用程序,其在日期时间数据方面所支持的功能也都非常给力,这篇文章主要给大家介绍了关于PostgreSQL设置时区、时间/日期函数的相关资料,需要的朋友可以参考下
    2023-09-09
  • postgresql减少wal日志生成量的操作

    postgresql减少wal日志生成量的操作

    这篇文章主要介绍了postgresql减少wal日志生成量的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • PostgreSQL中的外键与主键操作示例

    PostgreSQL中的外键与主键操作示例

    在PostgreSQL中,外键(Foreign Key)是一种用于建立表间关联的数据库约束机制,其核心作用与主键(Primary Key)有显著区别,本文给大家介绍PostgreSQL中的外键与主键操作示例,感兴趣的朋友一起看看吧
    2025-10-10
  • 解决postgresql无法远程访问的情况

    解决postgresql无法远程访问的情况

    这篇文章主要介绍了解决postgresql无法远程访问的情况,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • PostgreSQL对比Mysql分析

    PostgreSQL对比Mysql分析

    PostgreSQL功能完备、标准严格,适配复杂场景与数据分析,MySQL简单高效、高并发优势明显,适合读密集型应用,选择应基于业务需求与团队技术栈,无绝对优劣,对PostgreSQL对比Mysql分析相关知识,感兴趣的朋友一起看看吧
    2025-07-07
  • PostgreSQL 逻辑复制 配置操作

    PostgreSQL 逻辑复制 配置操作

    这篇文章主要介绍了PostgreSQL 逻辑复制 配置操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • docker快速部署postgresql的完整步骤记录

    docker快速部署postgresql的完整步骤记录

    PostgreSQL (pSQL) 是一个功能强大的开源关系型数据库系统,使用 Docker 部署 PostgreSQL 可以快速搭建开发、测试或生产环境,下面这篇文章主要介绍了docker快速部署postgresql的相关资料,需要的朋友可以参考下
    2025-09-09
  • PostGIS的安装与入门使用指南

    PostGIS的安装与入门使用指南

    在安装PostGIS前首先必须安装PostgreSQL,然后再安装好的Stack Builder中选择安装PostGIS组件。本文重点给大家介绍PostGIS的安装与入门使用指南,感兴趣的朋友一起看看吧
    2022-01-01

最新评论