GreenPlum在何时会发生自动故障切换及如何查询(OOM)

0    218    2

Tags:

👉 本文共约1577个字,系统预计阅读时间或需6分钟。

简介

若发生了OOM,则在gpcc的告警通知里会有“[告警]Out of memory errors”,例如:

GreenPlum在何时会发生自动故障切换及如何查询(OOM)

情况1(大部分情况):发生了OOM

发生自动切换的一个示例是发生了OOM,在master的日志文件中会有如下的内容:

“FTS: cannot establish libpq connection (content=0, dbid=11): could not fork new process for connection: Cannot allocate memory”或“FATAL: Out of memory. Failed on request of size 144 bytes. (context 'GPORCAmemory pool') ”或“ATAL: the database system is in recovery mode”,

若没有swap内存配置,会发生OOM,特别严重时会导致segment自动故障切换。

情况2:CPU压力或主机压力较大导致系统资源不足

当某个节点的CPU压力较大或主机压力较大导致系统资源不足时也会发生故障启动切换。

例如,最大进程数超限,此时,日志报错:

该报错,多半是因为内核参数没有做修改,修复如下:

重启主机生效。

参考:https://www.xmmup.com/linuxzhongdesoft-nproc-hard-nprocsoft-nofilehard-nofileulimitdezuidajinchengshuhezuidaai.html

情况3:kill掉实例

当手工kill掉某个PG实例后,也会自动发生切换。

排查SQL

自动故障切换模拟

原来环境

模拟故障

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务,私聊QQ646634621或微信db_bao,谢谢!
GreenPlum在何时会发生自动故障切换及如何查询(OOM)后续精彩内容已被小麦苗无情隐藏,请输入验证码解锁本站所有文章
验证码:
请关注本站微信公众号,回复“小麦苗博客”,获取验证码。在微信里搜索“DB宝”或者“www_xmmup_com”或者微信扫描右侧二维码都可以关注本站微信公众号。

标签:

Avatar photo

小麦苗

学习或考证,均可联系麦老师,请加微信db_bao或QQ646634621

您可能还喜欢...

发表回复

嘿,我是小麦,需要帮助随时找我哦
  • 18509239930
  • 个人微信

  • 麦老师QQ聊天
  • 个人邮箱
  • 点击加入QQ群
  • 个人微店

  • 回到顶部