第一点的原因是PostgreSQL数据的更新和删除操作并不是真正放到数据库空间.如果不定期释放空间的话,由于数据太多,查询速度会巨降.
第二点的原因是PostgreSQL在做查询处理的时候,为了使查询速度提高,会根据统计数据来确定执行计划.如果不及时更新的话,查询的效果可能不如预期.
第三点的原因是PostgreSQL中每一个事务都会产生一个事务ID,但这个数字是有上限的. 当事务ID达到最大值后,会重新从最小值开始循环.这样如果不及时把以前的数据释放掉的话,原来的老数据会因为事务ID的丢失而丢失掉.

虽然在新版本的Postgresql中有自动的vacuum，但是如果是大批量的数据IO可能会导致自动执行很慢，需要配合手动执行以及自己的脚本来清理数据库。

注意：
vacuum可以与dml并行运行，但不能与ddl并行运行
vacuum full不能与dml、ddl并行运行
允许VACUUM并行处理表的索引，方法是通过PARALLEL参数控制是否开启并行vacuum索引。
vacuumdb命令可以并行，指定--parallel选项。
reindexdb命令可以并行，指定--jobs选项。

VACUUM命令

postgres=# \h vacuum
Command:     VACUUM
Description: garbage-collect and optionally analyze a database
Syntax:
VACUUM [ ( option [, ...] ) ] [ table_and_columns [, ...] ]
VACUUM [ FULL ] [ FREEZE ] [ VERBOSE ] [ ANALYZE ] [ table_and_columns [, ...] ]

where option can be one of:

    FULL [ boolean ]
    FREEZE [ boolean ]
    VERBOSE [ boolean ]
    ANALYZE [ boolean ]
    DISABLE_PAGE_SKIPPING [ boolean ]
    SKIP_LOCKED [ boolean ]
    INDEX_CLEANUP [ boolean ]
    TRUNCATE [ boolean ]
    PARALLEL integer

and table_and_columns is:

    table_name [ ( column_name [, ...] ) ]

URL: https://www.postgresql.org/docs/13/sql-vacuum.html

postgres=# \h vacuum

Command: VACUUM

Description: garbage-collect and optionally analyze a database

Syntax:

VACUUM [ ( option [, ...] ) ] [ table_and_columns [, ...] ]

VACUUM [ FULL ] [ FREEZE ] [ VERBOSE ] [ ANALYZE ] [ table_and_columns [, ...] ]

where option can be one of:

FULL [ boolean ]

FREEZE [ boolean ]

VERBOSE [ boolean ]

ANALYZE [ boolean ]

DISABLE_PAGE_SKIPPING [ boolean ]

SKIP_LOCKED [ boolean ]

INDEX_CLEANUP [ boolean ]

TRUNCATE [ boolean ]

PARALLEL integer

and table_and_columns is:

table_name [ ( column_name [, ...] ) ]

URL: https://www.postgresql.org/docs/13/sql-vacuum.html

描述

VACUUM收回由死亡元组占用的存储空间。在通常的PostgreSQL操作中，被删除或者被更新废弃的元组并没有在物理上从它们的表中移除，它们将一直存在直到一次VACUUM被执行。因此有必要周期性地做VACUUM，特别是在频繁被更新的表上。

在没有table_and_columns列表的情况下，VACUUM会处理当前用户具有清理权限的当前数据库中的每一个表和物化视图。如果给出一个列表，VACUUM可以只处理列表中的那些表。

VACUUM ANALYZE对每一个选定的表ANALYZE。这是两种命令的一种方便的组合形式，可以用于例行的维护脚本。其处理细节可参考ANALYZE。

简单的 VACUUM（不带FULL）简单地收回空间并使其可以被重用。这种形式的命令可以和表的普通读写操作并行，因为它不会获得一个排他锁。但是，这种形式中额外的空间并没有被还给操作系统（在大多数情况下），它仅仅被保留在同一个表中以备重用。它还允许我们利用多个 CPU 来处理索引。此功能称为parallel vacuum。要禁用此功能，可以使用PARALLEL选项并将并行工作程序指定为零。

VACUUM FULL将表的整个内容重写到一个新的磁盘文件中，并且不包含额外的空间，这使得没有被使用的空间被还给操作系统。这种形式的命令更慢并且在其被处理时要求在每个表上保持一个排他锁。

当选项列表被包围在圆括号中时，选项可以被写成任何顺序。如果没有圆括号，选项必须严格按照上面所展示的顺序指定。有圆括号的语法在PostgreSQL 9.0时被加入，无圆括号的语法则被废弃。

参数

FULL
选择“完全”清理，它可以收回更多空间，并且需要更长时间和表上的排他锁。这种方法还需要额外的磁盘空间，因为它会创建该表的一个新拷贝，并且在操作完成之前都不会释放旧的拷贝。通常这种方法只用于需要从表中收回数量庞大的空间时。
FREEZE
选择激进的元组“冻结”。指定FREEZE 等价于参数vacuum_freeze_min_age和 vacuum_freeze_table_age设置为0的 VACUUM。当表被重写时总是会执行激进的冻结，因此指定FULL时这个选项是多余的。
VERBOSE
为每个表打印一份详细的清理活动报告。
ANALYZE
更新优化器用以决定最有效执行一个查询的方法的统计信息。
DISABLE_PAGE_SKIPPING
通常，VACUUM将基于可见性映射跳过页面。已知所有元组都被冻结的页面总是会被跳过，而那些所有元组对所有事务都可见的页面则可能会被跳过（除非执行的是激进的清理）。此外，除非在执行激进的清理时，一些页面也可能会被跳过，这样可避免等待其他页面完成对其使用。这个选项禁用所有的跳过页面的行为，其意图是只在可见性映射内容被怀疑时使用，这种情况只有在硬件或者软件问题导致数据库损坏时才会发生。

SKIP_LOCKED

规定VACUUM在开始处理关系时不等待任何冲突锁被释放：如果关系不能立即锁定而不等待，则跳过关系。请注意即使采用此选项，VACUUM在打开关系的索引时仍可能阻塞。此外，VACUUM ANALYZE在从分区、继承子表和某些类型的外表获取示例行时，仍然可能阻塞。还有，虽然VACUUM通常处理指定分区表的所有分区，但如果分区表上的锁冲突，此选项将导致VACUUM跳过所有分区。

在pg12中，VACUUM命令新增了SKIP_LOCKED选项。SKIP_LOCKED选项的作用是，vacuum命令会跳过那些被lock住的table，并且此时vacuum命令会被看做是成功执行。在之前的版本中，vacuum命令遇到了lock住的table时，vacuum命令会一直在等待。

在第一个session中执行lock table操作：

[pg124@iZm5ehqfjhnsbtxrzrnh2zZ ~]$ psql -d postgres
psql (12.4)
Type 'help' for help.

postgres=# begin;
BEGIN
postgres=# lock table t in exclusive mode;
LOCK TABLE
postgres=#

[pg124@iZm5ehqfjhnsbtxrzrnh2zZ ~]$ psql -d postgres

psql (12.4)

Type 'help' for help.

postgres=# begin;

BEGIN

postgres=# lock table t in exclusive mode;

LOCK TABLE

postgres=#

然后在第二个session中进行vacuum测试：

[pg124@iZm5ehqfjhnsbtxrzrnh2zZ ~]$ psql -d postgres
psql (12.4)
Type 'help' for help.

postgres=#  VACUUM t; --->>>首先不带skip_locked选项，结果vacuum t一直hang着，也就是说不带skip_locked选项时，vacuum命令是不跳过被锁定的table的。
^CCancel request sent
ERROR:  canceling statement due to user request
postgres=#  VACUUM  skip_locked t;
ERROR:  syntax error at or near 't'
LINE 1: VACUUM  skip_locked t;
                          ^
postgres=#  VACUUM  (skip_locked) t;
WARNING:  skipping vacuum of 't' --- lock not available
VACUUM
postgres=# 
postgres=# \echo :SQLSTATE
00000
postgres=#

[pg124@iZm5ehqfjhnsbtxrzrnh2zZ ~]$ psql -d postgres

psql (12.4)

Type 'help' for help.

postgres=# VACUUM t; --->>>首先不带skip_locked选项，结果vacuum t一直hang着，也就是说不带skip_locked选项时，vacuum命令是不跳过被锁定的table的。

^CCancel request sent

ERROR: canceling statement due to user request

postgres=# VACUUM skip_locked t;

ERROR: syntax error at or near 't'

LINE 1: VACUUM skip_locked t;

postgres=# VACUUM (skip_locked) t;

WARNING: skipping vacuum of 't' --- lock not available

VACUUM

postgres=#

postgres=# \echo :SQLSTATE

00000

postgres=#

INDEX_CLEANUP
规定VACUUM尝试删除指向死元组的索引条目。这通常是所需的行为，并且是默认行为，除非将vacuum_index_cleanup 选项设置为 false，对要被清空的表。如果需要尽快运行清空操作的话，将此选项设置为 false 可能很有用，例如，为了避免即将发生的事务 ID 回绕[wraparound]（请参阅第 24.1.5 节）。但是，如果不定期执行索引清理，性能可能会受到影响，因为随着表的修改，索引将累积死元组，并且表本身将累积死行指针，在索引清理完成之前都无法删除。此选项对于没有索引的表无效，如果使用 FULL 选项，则忽略此选项。

TRUNCATE

指定VACUUM尝试截断表末尾的任何空页，并允许将截断页的磁盘空间返回到操作系统。这通常是所需的行为，并且是默认行为，除非将vacuum_truncate选项设置为 false，对要被清空的表。将此选项设置为 false 可能有助于避免ACCESS EXCLUSIVE锁定需要截断的表。如果使用FULL选项，则忽略此选项。

在pg12中，vacuum带有TRUNCATE选项。当vacuum(TRUNCATE off)时，vacuum不会对该table中尾部的free area区域进行回收，若是vacuum不带truncate选项，那么需要看该table的VACUUM_TRUNCATE属性设置。

postgres=# VACUUM (VERBOSE ON, TRUNCATE OFF) t1 ;
INFO:  vacuuming 'public.t1'
INFO:  scanned index 'idx_t1' to remove 4000 row versions
DETAIL:  CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s
INFO:  't1': removed 4000 row versions in 18 pages
DETAIL:  CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s
INFO:  index 'idx_t1' now contains 0 row versions in 23 pages
DETAIL:  4000 index row versions were removed.
20 index pages have been deleted, 10 are currently reusable.
CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s.
INFO:  't1': found 4000 removable, 0 nonremovable row versions in 18 out of 18 pages
DETAIL:  0 dead row versions cannot be removed yet, oldest xmin: 607
There were 0 unused item identifiers.
Skipped 0 pages due to buffer pins, 0 frozen pages.
0 pages are entirely empty.
CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s.
VACUUM
postgres=#

postgres=# VACUUM (VERBOSE ON, TRUNCATE OFF) t1 ;

INFO: vacuuming 'public.t1'

INFO: scanned index 'idx_t1' to remove 4000 row versions

DETAIL: CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s

INFO: 't1': removed 4000 row versions in 18 pages

DETAIL: CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s

INFO: index 'idx_t1' now contains 0 row versions in 23 pages

DETAIL: 4000 index row versions were removed.

20 index pages have been deleted, 10 are currently reusable.

CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s.

INFO: 't1': found 4000 removable, 0 nonremovable row versions in 18 out of 18 pages

DETAIL: 0 dead row versions cannot be removed yet, oldest xmin: 607

There were 0 unused item identifiers.

Skipped 0 pages due to buffer pins, 0 frozen pages.

0 pages are entirely empty.

CPU: user: 0.00 s, system: 0.00 s, elapsed: 0.00 s.

VACUUM

postgres=#

PARALLEL
使用integer后台处理器并行执行VACUUM 的索引真空和索引清理阶段（每个真空阶段的详细信息请参考表 27.25)）。用于执行操作的处理器数量等于关系上支持并行清理的索引数量，该数量受PARALLEL 选项指定的工人数量的限制，如果有的话，该数量还受到 max_parallel_maintenance_workers 限制。当且仅当索引的大小大于min_parallel_index_scan_size时，索引才能参与并行清理。请注意，不保证在执行期间会使用integer中指定的并行工作线程数。清理运行时可能需要比指定的更少的处理器，甚至根本没有处理器。每个索引只能使用一名处理器。所以只有当表中至少有2索引时才会启动并行工作程序。在每个阶段开始之前启动清理工作进程，并在阶段结束时退出。这些行为可能会在未来的版本中发生变化。此选项不能与FULL选项一起使用。
boolean
指定打开还是关闭所选选项。你可以写入TRUE、ON或1以启用该选项，以及FALSE、OFF或0来禁用它。在TRUE被假定的情况下，boolean 值也可以被省略。
integer
指定传递给所选选项的非负整数值。
table_name
要清理的表或物化视图的名称（可以有模式修饰）。如果指定的表示一个分区表，则它所有的叶子分区也会被清理。
column_name
要分析的指定列的名称。缺省是所有列。如果指定了一个列的列表，则ANALYZE也必须被指定。

输出

如果声明了VERBOSE，VACUUM会发出进度消息来表明当前正在处理哪个表。各种有关这些表的统计信息也会打印出来。

注意

要清理一个表，操作者通常必须是表的拥有者或者超级用户。但是，数据库拥有者被允许清理他们的数据库中除了共享目录之外的所有表（对于共享目录的限制意味着一个真正的数据库范围的VACUUM只能被超级用户执行）。VACUUM将会跳过执行者不具备清理权限的表。

VACUUM不能在一个事务块内被执行。

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务，私聊QQ646634621或微信db_bao，谢谢！

后续精彩内容已被小麦苗无情隐藏，请输入验证码解锁本站所有文章！

请先关注本站微信公众号，然后回复“验证码”，获取验证码。在微信里搜索“DB宝”或者“www_xmmup_com”或者微信扫描右侧二维码都可以关注本站微信公众号。

打赏赞(12)

标签： PG PostgreSQL 新特性索引并行 vacuum vacuumdb

小麦苗

学习或考证，均可联系麦老师，请加微信db_bao或QQ646634621

小麦苗说道：

2021年7月26日上午11:19

在pg12中vacuumdb命令新增了--min-xid-age和--min-mxid-age选项

--min-xid-age 用于指定：针对那些事务id age超过本参数值的table，才进行vacuum或者analyze，仅仅对大于等于PG9.6版本才有效。
--min-mxid-age用于指定：针对那些multixact id age超过本参数值的table，才进行vacuum或者analyze，仅仅对大于等于PG9.6版本才有效。

vacuumdb的--skip-locked选项的作用是跳过被locked的table

在pg12中vacuumdb命令新增了--min-xid-age和--min-mxid-age选项

--min-xid-age 用于指定：针对那些事务id age超过本参数值的table，才进行vacuum或者analyze，仅仅对大于等于PG9.6版本才有效。

--min-mxid-age用于指定：针对那些multixact id age超过本参数值的table，才进行vacuum或者analyze，仅仅对大于等于PG9.6版本才有效。

vacuumdb的--skip-locked选项的作用是跳过被locked的table

David.cui说道：
2021年7月3日下午9:24
是不是应该描述的时候顺便解释一下和maintenance_work_mem的关系
登录以回复
- 小麦苗说道：
  2021年7月5日上午8:59
  在维护操作比如:VACUUM(收集表和索引的统计信息，整理表和索引)、CREATE INDEX、ALTER TABLE ADD FOREIGN Key等中都会使用maintenance_work_mem内存缓冲区。
  登录以回复

发表回复取消回复

要发表评论，您必须先登录。

2024年 4月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

嘿，我是小麦，需要帮助随时找我哦。

18509239930
个人微信
DB宝
个人邮箱
点击加入QQ群
个人微店
回到顶部

合 PG中的vacuum和vacuumdb命令

VACUUM简介

VACUUM命令

描述

参数

输出

注意

相关文章

您可能还喜欢...

3 条回复

发表回复取消回复

网站公告

网站寄语

本站其它工具

搜索本网站

标签云☁

网站日历

网站归档

网站分类

合 PG中的vacuum和vacuumdb命令

VACUUM简介

VACUUM命令

描述

参数

输出

注意

相关文章

您可能还喜欢...

PG中的组合查询

PG中的物化视图

PG中的查询规划执行计划explain参数

3 条回复

发表回复 取消回复

网站公告

网站寄语

本站其它工具

搜索本网站

标签云☁

网站日历

网站归档

网站分类

发表回复取消回复