PG中的并行

0    249    1

👉 本文共约12269个字,系统预计阅读时间或需47分钟。

简介

官网:http://postgres.cn/docs/13/parallel-query.html

PG从9.6开始支持并行查询,在10版本中,默认开启并行执行;在负载重的oltp系统上,建议关闭并行执行。

PostgreSQL能设计出利用多 CPU 让查询更快的查询计划。这种特性被称为并行查询。由于现有实现的限制或者因为没有比连续查询计划更快的查询计划存在,很多查询并不能从并行查询获益。不过,对于那些可以从并行查询获益的查询来说,并行查询带来的速度提升是显著的。很多查询在使用并行查询时比之前快了超过两倍,有些查询是以前的四倍甚至更多的倍数。那些访问大量数据但只返回其中少数行给用户的查询最能从并行查询中获益。

postgresql 11 对parallel又有了进一步的加强 。

  • 并行创建btree索引(Parallel Index Builds)
  • 使用共享hash table时可以并行执行hash join
  • 单个选择如果不能并行化,则允许UNION并行运行每个SELECT
  • 并行扫描分区表
  • 允许 limit 传递给并行进程
  • 允许并行进程使用索引扫描式减少返回结果
  • 允许并行化单个计算查询、where子句聚合查询和目标列表中的函数
  • 新加参数 parallel_leader_participation 控制执行计划中的领导者,默认启用。
  • 并行执行CREATE TABLE … AS, CREATE MATERIALIZED VIEW, certain queries using UNION
  • 并行hash join、并行顺序扫描在多并行进程下得到加强
  • 在EXPLAIN中添加并行进程排序活动的报告

常用参数

本人提供Oracle、MySQL、PG等数据库的培训和考证业务,私聊QQ646634621或微信db_bao,谢谢!
  • max_work_processes(integer)

这个设置是当前系统中支持的最大后台进程数,默认为8

如果备库设置,备库上此参数必须大于或等于主库上的此参数配置值

此参数调整,需要重启数据库生效

  • max_parallel_workers

设置系统支持的并行查询进程数,默认8

这个参数值不能高于max_worker_processes

调整这个参数,建议同时调整max_parallel_workers_per_gather参数值

  • max_parallel_workers_per_gather

设置允许启用的并行进程的进程数,默认2

设置成0,表示禁用并行进程。

设置单个Gather或Gather Merge节点能够启用的最大并行进程数,默认值为2,并行查询(Parallel Query)的并行度受此参数的影响,CREATE INDEX 命令的并行度不受此参数影响。

  • max_parallel_maintenance_workers

支持内建的过程使用并行的方式工作,例如建立索引,默认设置为2。

该参数设置维护命令(例如 CREATE INDEX) 命令允许的最大并行进程数,默认值为2。

  • parallel_setup_cost(floating point)

设置优化器启动并行进程的成本,默认为1000

  • parallel_tuple_cost(floating point)

设置优化器通过并行进程处理一行数据的成本,默认为0.1

  • min_parallel_table_scan_size(integer)

设置开启并行的条件之一,表占用空间小于此值将不会开启并行

并行顺序扫描场景下扫描的数据大小通常等于表大小,默认值8M

  • min_parallel_index_scan_size(integer)

设置开启并行的条件之一,实际上并行扫描不会扫描索引所有数据块

只是扫描索引相关数据块,默认值为512kb

  • force_parallel_mode(enum)

强制开启并行,一般作为测试目的

其中的关系应该是

max_work_processes > max_parallel_workers > max_parallel_workers_per_gather >= max_parallel_maintenance_workers

以上参数可能并不容易理解,进一步解释如下:

  1. max_worker_processes 参数设置的是数据库允许的最大后台进程数,并行进程属于后台进程的一种;
  2. max_parallel_workers 参数设置数据库允许的最大并行进程数,这个值小于或等于 max_worker_processes。
  3. 并行进程数设置分为两类,第一类是并行查询,并行查询的并行度由 max_parallel_workers_per_gather 参数控制,第二类是维护命令(例如 CREATE INDEX),维护命令的并行度由 max_parallel_maintenance_workers 参数控制
  4. max_parallel_workers_per_gather+max_parallel_maintenance_workers值应小于或等于 max_parallel_workers。

配置示例

并行查询如何工作

当优化器判断对于某一个特定的查询,并行查询是最快的执行策略时,优化器将创建一个查询计划。该计划包括一个 Gather或者Gather Merge节点。下面是一个简单的例子:

在所有的情形下,GatherGather Merge节点都只有一个子计划,它是将被并行执行的计划的一部分。如果GatherGather Merge节点位于计划树的最顶层,那么整个查询将并行执行。如果它位于计划树的其他位置,那么只有查询中在它之下的那一部分会并行执行。在上面的例子中,查询只访问了一个表,因此除Gather节点本身之外只有一个计划节点。因为该计划节点是Gather节点的孩子节点,所以它会并行执行。

使用 EXPLAIN命令, 你能看到规划器选择的工作者数量。当查询执行期间到达Gather节点时,实现用户会话的进程将会请求和规划器选中的工作者数量一样多的后台工作者进程 。规划器将考虑使用的后台工作者的数量被限制为最多max_parallel_workers_per_gather个。任何时候能够存在的后台工作者进程的总数由max_worker_processesmax_parallel_workers限制。因此,一个并行查询可能会使用比规划中少的工作者来运行,甚至有可能根本不使用工作者。最优的计划可能取决于可用的工作者的数量,因此这可能会导致不好的查询性能。如果这种情况经常发生,那么就应当考虑一下提高max_worker_processesmax_parallel_workers的值,这样更多的工作者可以同时运行;或者降低max_parallel_workers_per_gather,这样规划器会要求少一些的工作者。

为一个给定并行查询成功启动的后台工作者进程都将会执行计划的并行部分。这些工作者的领导者也将执行该计划,不过它还有一个额外的任务:它还必须读取所有由工作者产生的元组。当整个计划的并行部分只产生了少量元组时,领导者通常将表现为一个额外的加速查询执行的工作者。反过来,当计划的并行部分产生大量的元组时,领导者将几乎全用来读取由工作者产生的元组并且执行GatherGather Merge节点上层计划节点所要求的任何进一步处理。在这些情况下,领导者所作的执行并行部分的工作将会很少。

当计划的并行部分的顶层节点是Gather Merge而不是Gather时,它表示每个执行计划并行部分的进程会产生有序的元组,并且领导者执行一种保持顺序的合并。相反,Gather会以任何方便的顺序从工作者读取元组,这会破坏可能已经存在的排序顺序。

何时会用到并行查询?

有几种设置会导致查询规划器在任何情况下都不生成并行查询计划。为了让并行查询计划能够被生成,必须配置好下列设置。

  • max_parallel_workers_per_gather必须被设置为大于零的值。这是一种特殊情况,更加普遍的原则是所用的工作者数量不能超过max_parallel_workers_per_gather所配置的数量。

此外,系统一定不能运行在单用户模式下。因为在单用户模式下,整个数据库系统运行在单个进程中,没有后台工作者进程可用。

如果下面的任一条件为真,即便对一个给定查询通常可以产生并行查询计划,规划器都不会为它产生并行查询计划:

  • 查询要写任何数据或者锁定任何数据库行。如果一个查询在顶层或者 CTE 中包含了数据修改操作,那么不会为该查询产生并行计划。一种例外是,CREATE TABLE ... ASSELECT INTO以及CREATE MATERIALIZED VIEW这些创建新表并填充它的命令可以使用并行计划。
  • 查询可能在执行过程中被暂停。只要在系统认为可能发生部分或者增量式执行,就不会产生并行计划。例如:用DECLARE CURSOR创建的游标将永远不会使用并行计划。类似地,一个FOR x IN query LOOP .. END LOOP形式的 PL/pgSQL 循环也永远不会使用并行计划,因为当并行查询进行时,并行查询系统无法验证循环中的代码执行起来是安全的。
  • 使用了任何被标记为PARALLEL UNSAFE的函数的查询。大多数系统定义的函数都被标记为PARALLEL SAFE,但是用户定义的函数默认被标记为PARALLEL UNSAFE。参见第 15.4 节中的讨论。
  • 该查询运行在另一个已经存在的并行查询内部。例如,如果一个被并行查询调用的函数自己发出一个 SQL 查询,那么该查询将不会使用并行计划。这是当前实现的一个限制,但是或许不值得移除这个限制,因为它会导致单个查询使用大量的进程。

即使对于一个特定的查询已经产生了并行查询计划,在一些情况下执行时也不会并行执行该计划。如果发生这种情况,那么领导者将会自己执行该计划在Gather节点之下的部分,就好像Gather节点不存在一样。上述情况将在满足下面的任一条件时发生:

  • 因为后台工作者进程的总数不能超过max_worker_processes,导致不能得到后台工作者进程。
  • 由于为并行查询目的启动的后台工作者数量不能超过max_parallel_workers这一限制而不能得到后台工作者。
  • 客户端发送了一个执行消息,并且消息中要求取元组的数量不为零。执行消息可见扩展查询协议中的讨论。因为libpq当前没有提供方法来发送这种消息,所以这种情况只可能发生在不依赖 libpq 的客户端中。如果这种情况经常发生,那在它可能发生的会话中设置 max_parallel_workers_per_gather为零是一个很好的主意,这样可以避免产生连续运行时次优的查询计划。

并行计划

因为每个工作者只执行完成计划的并行部分,所以不可能简单地产生一个普通查询计划并使用多个工作者运行它。每个工作者都会产生输出结果集的一个完全拷贝,因而查询并不会比普通查询运行得更快甚至还会产生不正确的结果。相反,计划的并行部分一定被查询优化器在内部当作一个部分计划,即它必须被构建出来,这样每一个执行该计划的进程将以无重复地方式产生输出行的一个子集,即保证每一个所需要的输出行正好只被一个合作进程生成。通常,这意味着该查询的驱动表上的扫描必须是一种可并行的扫描。

并行扫描

当前支持下列可并行的表扫描。

  • 在一个并行顺序扫描中,表块将在合作进程之间被划分。一次会分发一个块,这样对表的访问还是保持顺序方式。
  • 在一个并行位图堆扫描中,一个进程被选为领导者。这个进程执行对一个或者多个索引的扫描并且构建出一个位图指示需要访问哪些表块。这些表块接着会在合作进程之间划分(和并行顺序扫描中一样)。换句话说,堆扫描以并行方式进行但底层的索引扫描不是并行。
  • 在一个并行索引扫描或者并行只用索引的扫描中,合作进程轮流从索引读取数据。当前,并行索引扫描仅有B-树索引支持。每一个进程将认领一个索引块并且扫描和返回该索引块引用的所有元组,其他进程可以同时地从一个不同的索引块返回元组。并行B-树扫描的结果会以每个工作者进程内的顺序返回。

其他扫描类型(例如非B-树索引的扫描)可能会在未来支持并行扫描。

并行连接

正如在非并行计划中那样,驱动表可能被使用嵌套循环、哈希连接或者归并连接连接到一个或者多个其他表。连接的内侧可以是任何类型的被规划器支持的非并行计划,假设它能够安全地在并行工作者中运行。根据连接类型,内侧还可以是一种并行计划。

  • 在一个嵌套循环连接中,内侧总是非并行的。尽管它会被完全执行,如果内侧是一个索引扫描也会很高效,因为外侧元组以及在索引中查找值的循环会被划分到多个合作进程。
  • 在一个归并连接中,内侧总是一个非并行计划并且因此会被完全执行。这可能是不太高效的,特别是在排序必须被执行时,因为在每一个合作进程中工作数据和结果数据是重复的。
  • 在一个哈希连接(没有“并行”前缀)中,每个合作进程都会完全执行内侧以构建哈希表的相同拷贝。如果哈希表很大或者该计划开销很大,这种方式就很低效。在一个并行哈希连接中,内侧是一个并行哈希,它把构建共享哈希表的工作划分到多个合作进程。

并行聚集

PostgreSQL通过按两个阶段进行聚集来支持并行聚集。首先,每个参与到查询并行部分的进程执行一个聚集步骤,为该进程注意到的每个分组产生一个部分结果。这在计划中反映为一个Partial Aggregate节点。然后,部分结果通过Gather或者Gather Merge被传输到领导者。最后,领导者对来自所有工作者的结果进行重新聚集得到最终的结果。这在计划中反映为一个Finalize Aggregate节点。

因为Finalize Aggregate节点运行在领导者进程上,如果查询产生的分组数相对于其输入行数来说比较大,则查询规划器不会喜欢它。例如,在最坏的情况下,Finalize Aggregate节点看到的分组数可能与所有工作者进程在Partial Aggregate阶段看到的输入行数一样多。对于这类情况,使用并行聚集显然得不到性能收益。查询规划器会在规划过程中考虑这一点并且不太会在这种情况下选择并行聚集。

并行聚集并非在所有情况下都被支持。每一个聚集都必须是对并行安全的并且必须有一个组合函数。如果该聚集有一个类型为internal的转移状态,它必须有序列化和反序列化函数。更多细节请参考CREATE AGGREGATE。如果任何聚集函数调用包含DISTINCTORDER BY子句,则不支持并行聚集。对于有序集聚集或者当查询涉及GROUPING SETS时,也不支持并行聚集。只有在查询中涉及的所有连接也是该计划并行部分的组成部分时,才能使用并行聚集。

并行Append

只要当PostgreSQL需要从多个源中整合行到一个单一结果集时,它会使用AppendMergeAppend计划节点。在实现UNION ALL或扫描分区表时常常会发生这种情况。就像这些节点可以被用在任何其他计划中一样,它们可以被用在并行计划中。不过,在并行计划中,规划器使用的是Parallel Append节点。

当一个Append节点被用在并行计划中时,每个进程将按照子计划出现的顺序执行子计划,这样所有的参与进程会合作执行第一个子计划直到它被完成,然后同时移动到第二个计划。而在使用Parallel Append时,执行器将把它的子计划尽可能均匀地散布在参与进程中,这样多个子计划会被同时执行。这避免了竞争,也避免了子计划在那些不执行它的进程中产生启动代价。

此外,和常规的Append节点不同(在并行计划中使用时仅有部分子计划),Parallel Append节点既可以有部分子计划也可以有非部分子计划。非部分子计划将仅被单个进程扫描,因为扫描它们不止一次会产生重复的结果。因此涉及到追加多个结果集的计划即使在没有有效的部分计划可用时,也能实现粗粒度的并行。例如,考虑一个针对分区表的查询,它只能通过使用一个不支持并行扫描的索引来实现。规划器可能会选择常规Index Scan计划的Parallel Append。每个索引扫描必须被单一的进程执行完,但不同的扫描可以由不同的进程同时执行。

enable_parallel_append可以被用来禁用这种特性。

并行计划小贴士

如果我们想要一个查询能产生并行计划但事实上又没有产生,可以尝试减小parallel_setup_cost或者parallel_tuple_cost。当然,这个计划可能比规划器优先产生的顺序计划还要慢,但也不总是如此。如果将这些设置为很小的值(例如把它们设置为零)也不能得到并行计划,那就可能是有某种原因导致查询规划器无法为你的查询产生并行计划。可能的原因可见第 15.2 节第 15.4 节

在执行一个并行计划时,可以用EXPLAIN (ANALYZE,VERBOSE)来显示每个计划节点在每个工作者上的统计信息。这些信息有助于确定是否所有的工作被均匀地分发到所有计划节点以及从总体上理解计划的性能特点。

并行安全性

规划器把查询中涉及的操作分类成并行安全并行受限或者并行不安全。并行安全的操作不会与并行查询的使用产生冲突。并行受限的操作不能在并行工作者中执行,但是能够在并行查询的领导者中执行。因此,并行受限的操作不能出现在Gather或者Gather Merge节点之下,但是能够出现在包含这类节点的计划的其他位置。并行不安全的操作不能在并行查询中执行,甚至不能在领导者中执行。当一个查询包含任何并行不安全操作时,并行查询对这个查询是完全被禁用的。

下面的操作总是并行受限的。

  • 公共表表达式(CTE)的扫描。
  • 临时表的扫描。
  • 外部表的扫描,除非外部数据包装器有一个IsForeignScanParallelSafe API。
  • InitPlan所挂接到的计划节点。
  • 引用一个相关的SubPlan的计划节点。

为函数和聚集加并行标签

规划器无法自动判定一个用户定义的函数或者聚集是并行安全、并行受限还是并行不安全,因为这需要预测函数可能执行的每一个操作。一般而言,这就相当于一个停机问题,因此是不可能的。甚至对于可以做到判定的简单函数我们也不会尝试,因为那会非常昂贵而且容易出错。相反,除非是被标记出来,所有用户定义的函数都被认为是并行不安全的。在使用CREATE FUNCTION或者ALTER FUNCTION时,可以通过指定PARALLEL SAFEPARALLEL RESTRICTED或者PARALLEL UNSAFE来设置标记 。在使用CREATE AGGREGATE时,PARALLEL选项可以被指定为SAFERESTRICTED或者 UNSAFE

如果函数和聚集会写数据库、访问序列、改变事务状态(即便是临时改变,例如建立一个EXCEPTION块来捕捉错误的 PL/pgsql)或者对设置做持久化的更改,它们一定要被标记为PARALLEL UNSAFE。类似地,如果函数会访问临时表、客户端连接状态、游标、预备语句或者系统无法在工作者之间同步的后端本地状态,它们必须被标记为PARALLEL RESTRICTED。例如,setseedrandom由于后一种原因而是并行受限的。

一般而言,如果一个函数是受限或者不安全的却被标记为安全,或者它实际是不安全的却被标记为受限,把它用在并行查询中时可能会抛出错误或者产生错误的回答。如果 C 语言函数被错误标记,理论上它会展现出完全不明确的行为,因为系统中无法保护自身不受任意 C 代码的影响。但是,在最有可能的情况下,结果不会比其他任何函数更糟糕。如果有疑虑,最好还是标记函数为UNSAFE

如果在并行工作者中执行的函数要求领导者没有持有的锁,例如读该查询中没有引用的表,那么工作者退出时会释放那些锁(而不是在事务结束时释放)。如果你写了一个这样做的函数并且这种不同的行为对你很重要,把这类函数标记为PARALLEL RESTRICTED以确保它们只在领导者中执行。

注意查询规划器不会为了获取一个更好的计划而考虑延迟计算并行受限的函数或者聚集。所以,如果一个被应用到特定表的WHERE子句是并行受限的,查询规划器就不会考虑对处于计划并行部分的表执行一次扫描。在一些情况中,可以(甚至效率更高)把对表的扫描包括在查询的并行部分并且延迟对WHERE子句的计算,这样它会出现在Gather节点之上。不过,规划器不会这样做。

并行全表扫描

并行create table as

top+c可以显式命令的详情。

并行join

并行创建索引

PostgreSQL11:支持并行创建索引(Parallel Index Builds)

PostgreSQL 11 版本在并行方面得到增强,例如支持并行创建索引、并行Hash Join、并行 CREATE TABLE .. AS等。

PostgreSQL 11 版本并行创建索引仅支持 B-tree 索引。

测试环境准备

创建测试表big并插入3000万条数据,如下:

并行创建索引

在会话级设置max_parallel_maintenance_workers值为4。

创建索引,如下

在主机上通过 top 命令可以看到 CREATE INDEX 命令的进程号为 21164,并且开启了4个并发子进程。

PG中的并行

创建索引并行度测试

设置 max_parallel_maintenance_workers 值不同并行度,测试并行索引创建的时间。

本测试环境为一台4核8GB内存的虚机,测试结果如下:

max_parallel_maintenance_workers索引创建时间(毫秒)
014938.738
210469.283
410439.237
611577.147
817020.216

从以上看出,当 max_parallel_maintenance_workers 值为4时索引创建时间出现拐点。

关闭指定表并行创建索引

通过前面介绍大家知道可通过设置max_parallel_maintenance_workers参数为0关闭所有表的并行创建索引,如何关闭指定表的并行索引创建呢?

可通过 ALTER TABLE 方式禁止表上的并行创建索引,如下禁止表big上的所有并行创建索引。

如果想恢复指定表上的parallel_workers参数设置,使用 RESET 选项即可,如下:

参考

https://developer.aliyun.com/article/684431

《PostgreSQL 并行计算解说 之29 - parallel 递归查询, 树状查询, 异构查询, CTE, recursive CTE, connect by》

《PostgreSQL 并行计算解说 之28 - parallel CREATE INDEX CONCURRENTLY - 不堵塞读写》

《PostgreSQL 并行计算解说 之27 - parallel subquery》

《PostgreSQL 并行计算解说 之26 - parallel gather | gathermerge - enable leader worker process》

《PostgreSQL 并行计算解说 之25 - parallel FDW scan (并行访问多个外部表) with parallel append (FDW must with IsForeignScanParallelSafe)》

《PostgreSQL 并行计算解说 之24 - parallel CTE (Common Table Express)》

《PostgreSQL 并行计算解说 之23 - parallel union all》

《PostgreSQL 并行计算解说 之23 - parallel append merge》

《PostgreSQL 并行计算解说 之22 - parallel append》

《PostgreSQL 并行计算解说 之21 - parallel partition table wise agg》

《PostgreSQL 并行计算解说 之20 - parallel partition table wise join》

《PostgreSQL 并行计算解说 之19 - parallel hash join》

《PostgreSQL 并行计算解说 之18 - parallel merge join》

《PostgreSQL 并行计算解说 之17 - parallel nestloop join》

《PostgreSQL 并行计算解说 之16 - parallel index only scan》

《PostgreSQL 并行计算解说 之15 - parallel bitmap scan》

《PostgreSQL 并行计算解说 之14 - parallel index scan》

《PostgreSQL 并行计算解说 之13 - parallel OLAP : 中间结果 parallel with unlogged table》

《PostgreSQL 并行计算解说 之12 - parallel in rc,rr 隔离级别》

《PostgreSQL 并行计算解说 之11 - parallel gather, gather merge》

《PostgreSQL 并行计算解说 之10 - parallel 自定义并行函数(UDF)》

《PostgreSQL 并行计算解说 之9 - parallel 自定义并行聚合》

《PostgreSQL 并行计算解说 之8 - parallel sort》

《PostgreSQL 并行计算解说 之7 - parallel create index》

《PostgreSQL 并行计算解说 之6 - parallel CREATE MATERIALIZED VIEW》

《PostgreSQL 并行计算解说 之5 - parallel create table as》

《PostgreSQL 并行计算解说 之4 - parallel select into》

《PostgreSQL 并行计算解说 之3 - parallel agg》

《PostgreSQL 并行计算解说 之2 - parallel filter》

《PostgreSQL 并行计算解说 之1 - parallel seq scan》

https://www.postgresql.org/docs/11/parallel-plans.html

《PostgreSQL 11 并行计算算法,参数,强制并行度设置》

《PostgreSQL 11 preview - 并行计算 增强 汇总》

《PostgreSQL 10 自定义并行计算聚合函数的原理与实践 - (含array_agg合并多个数组为单个一元数组的例子)》

《PostgreSQL 9.6 并行计算 优化器算法浅析》

    头像

    小麦苗

    学习或考证,均可联系麦老师,请加微信db_bao或QQ646634621

    您可能还喜欢...

    发表评论

    您的电子邮箱地址不会被公开。

    18 + 16 =

     

    嘿,我是小麦,需要帮助随时找我哦
    • 18509239930
    • 个人微信

    • 麦老师QQ聊天
    • 个人邮箱
    • 点击加入QQ群
    • 个人微店

    • 回到顶部
    返回顶部