PostgreSQL 如何查找需要收集的vacuum 表信息

 更新时间:2021年02月05日 09:03:44   作者:SSsandata  
这篇文章主要介绍了PostgreSQL 如何查找需要收集的vacuum 表信息,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

前言

通常,在PostgreSQL中,由于经常需要对表进行 UPDATE 和 DELETE,因此表会产生碎片空间。

在 PostgreSQL中,使用VACUUM 仅仅对需要执行 VACUUM 表将已删除的空间标识为未使用,以便以后重用这些空间,但是不能立即将占用的空间返还给操作系统,因此需要使用 VACUUM FULL,才可以释放空间,并立即将空间返还给操作系统。

实现脚本

记录收集表创建

CREATE TABLE IF NOT EXISTS tab_vacuum_record
(sqltext text);

收集需要VACUUM 表函数

CREATE OR REPLACE FUNCTION f_vacuum_tables()
RETURNS void AS
$FUNCTION$
 DECLARE
 v_tablename text;
 v_dead_cond bigint;
 v_sql    text;
 cur_tablename REFCURSOR;
 v_vacuum_record text;
 BEGIN
 v_vacuum_record := 'tab_vacuum_record';
 OPEN cur_tablename FOR SELECT tablename FROM pg_tables WHERE tablename !~ '^pg|^sql';
 LOOP
  FETCH cur_tablename INTO v_tablename;
   SELECT n_dead_tup INTO v_dead_cond FROM pg_stat_user_tables WHERE relname = v_tablename;
     IF v_dead_cond > 0 THEN
      v_sql := 'INSERT INTO ' || v_vacuum_record || ' VALUES(' || chr(39) ||'VACUUM FULL ' || v_tablename ||';'|| chr(39) ||')';
    EXECUTE v_sql;
     END IF;
   EXIT WHEN NOT FOUND;
 END LOOP;
 CLOSE cur_tablename;
 END;
$FUNCTION$
LANGUAGE PLPGSQL;

SHELL脚本

#!/bin/bash
#获取环境变量
CURRDIR=$(cd "$(dirname $0)";pwd)
TOPDIR=$(cd $CURRDIR/..;pwd)
CONFIG=$TOPDIR/conf/host.ini
CT_FILE=${TOPDIR}/sql/CREATE_VACCUM_TABLE_RECORD.sql
CT_FUNCTION=${TOPDIR}/sql/CHECK_NEEDS_VACUUM_TABLE_FUNCTION.sql
source $CONFIG
CONNINFO="psql -U $USER -d $DBNAME -h $HOSTADDR -p $PORT"
function check_status()
{
    echo "检查数据库服务器状态是否正常 !"
    stat=`$CONNINFO -Aqt -c 'SELECT 1'`
    if [ "${stat}" == "1" ];then
        echo "服务器连接正常"
    else
        echo "服务器连接异常,退出"
        exit -1;
    fi
}
function create_table()
{
    echo "创建收集需要vacuum的表"
    $CONNINFO -f $CT_FILE
}
function create_function()
{
    echo "创建收集需要 vacuum 表的函数"
    $CONNINFO -f $CT_FUNCTION
}
check_status
create_table
create_function

执行方式

postgres=# SELECT * FROM f_vacuum_tables();
 f_vacuum_tables 
-----------------
 
(1 row)
--创建测试表
postgres=# CREATE TABLE tab_test(id int);
--插入数据
postgres=# INSERT INTO tab_test SELECT id FROM generate_series(1,100000) as id;
INSERT 0 100000
--删除数据
postgres=# DELETE FROM tab_Test WHERE id <= 10000;
DELETE 10002
postgres=# SELECT * FROM tab_vacuum_record ;
    sqltext    
-----------------------
 VACUUM FULL tab_test;
(1 row)

该脚本也可以自己根据需要进行修改,详细见github

补充:PostgreSQL中 Vacuum 略谈

VACUUM doc

路由清理

PostgreSQL 需要定期维护清理,一般都是由守护进程自动清理的,我们只是需要参数调优,也可以执行脚本定时去清理回收。

Vacuumming Basics

PG不得不对每张表进行 Vacuum 命令,原因如下:

1、为了回收和再利用通过更新或者删除行所占用的磁盘空间

2、为了更新被PG查询计划所使用的数据分析

3、为了更新只读索引扫描的可见的集合

4、避免由于事务ID或者混合事务ID丢失历史数据

由于这些原因,在进行频繁的 VACUUM 操作时进行规定:

标准 VACUUM

进行回收时,生产环境不影响数据库库的正常使用(SELECT、INSERT、UPDATE、DELETE),并行使用,清理时不允许对表结构进行修改(ALTER TABLE)推荐使用该方案

VACUUM FULL

a、可以回收大量空间,但是比标准回收执行慢

b、运行时需要锁表

VACUUM 运行会导致读写性能比较差,所以需要调整一些参数降低影响

temp_file_limit = -1 #默认-1表示不限制每个进程可使用的最大临时文件限制,单位kb
#max_files_per_process = 1000 #每个子进程允许同时打开文件的最大数量

在执行 VACUUM 和 ANYLYZE 期间,系统会维护一个用于估算各种I/O操作所消耗的内部计数器,当该值达到vacuum_cost_limit的值时,该进程会休眠 vacuum_cost_delay 指定的时间,并重置计数器的值,继续运行 VACUM 或者 ANYLYZE 操作

vacuum_cost_limit = 200 
vacuum_cost_delay = 0 # 单位微秒,默认为 0 没有开启

该参数 vacuum_cost_delay 主要用于并发时降低I/O的影响,推荐为10

vacuum_cost_page_hit = 1 # 代表从缓存池查找共享的hash table并扫描 该`页`的内容
             #的估计值
vacuum_cost_page_miss = 10   # 0-10000 credits
vacuum_cost_page_dirty = 20

NOTE

当一张表中包含了大量数据时,同时进行删除或者更新操作时,VACUUM 并不是最好的方案,

如果有该情况,则应该使用 VACUU FULL ,当执行 ALTER TABLE 时,会重新 COPY整

个表和重新构建索引,会进行执行锁,临时占用和原始表大小的磁盘空间,直到新数据COPY完成。

升级执行计划

执行计划通过自己或者 VACUUM调用命令 ANALYZE 收集统计,

创建 表达式索引 能够提高查询执行计划

default_statistics_target = 100 #提高查询的 析计划

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • PostgreSQL设置时间自动更新的示例代码

    PostgreSQL设置时间自动更新的示例代码

    在我们日常开发中,在设计数据库字段的时候不可避免的都要created_time以及updated_time两个时间戳字段,作用大家也都一目了然,下面将为大家详细介绍PostgreSQL设置时间自动更新的方法,需要的朋友可以参考下
    2025-03-03
  • PostgreSQL11修改wal-segsize的操作

    PostgreSQL11修改wal-segsize的操作

    这篇文章主要介绍了PostgreSQL11修改wal-segsize的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • PGSQL 实现查询今天,昨天的数据,一个月之内的数据

    PGSQL 实现查询今天,昨天的数据,一个月之内的数据

    这篇文章主要介绍了PGSQL 实现查询今天,昨天的数据,一个月之内的数据,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • PostgreSQL简介及实战应用

    PostgreSQL简介及实战应用

    PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高级特性、性能优化和实战应用,帮助读者全面掌握PostgreSQL,感兴趣的朋友跟随小编一起学习吧
    2025-08-08
  • postgresql 查询字符串中是否包含某字符的操作

    postgresql 查询字符串中是否包含某字符的操作

    这篇文章主要介绍了postgresql 查询字符串中是否包含某字符的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • Postgresql的select优化操作(快了200倍)

    Postgresql的select优化操作(快了200倍)

    这篇文章主要介绍了Postgresql的select优化操作(快了200倍),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • PostgreSQL 六大索引的方法小结

    PostgreSQL 六大索引的方法小结

    本文主要介绍了PostgreSQL 六大索引的方法小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-11-11
  • PostgreSQL主从搭建的实现步骤

    PostgreSQL主从搭建的实现步骤

    本文主要介绍了一主一从PostgreSQL架构,配置流复制账户及主从参数文件,执行基础备份,检查复制槽和节点状态以确认搭建成功,下面就来具体介绍一下,感兴趣的可以了解一下
    2025-07-07
  • postgresql 导出建表语句的命令操作

    postgresql 导出建表语句的命令操作

    这篇文章主要介绍了postgresql 导出建表语句的命令操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • Ubuntu PostgreSQL安装和配置的介绍

    Ubuntu PostgreSQL安装和配置的介绍

    今天小编就为大家分享一篇关于Ubuntu PostgreSQL安装和配置的介绍,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03

最新评论