ceph 集群异常导致K8S的pod异常

0    38    1

Tags:

👉 本文共约2042个字,系统预计阅读时间或需8分钟。

一 背景

收到测试环境集群告警,登陆 K8s 集群进行排查。

二 故障定位

2.1 查看 Pod

查看 kube-system node2 节点 calico pod 异常。

ceph 集群异常导致K8S的pod异常

查看详细信息,查看node2节点没有存储空间,cgroup泄露。

ceph 集群异常导致K8S的pod异常

2.2 查看存储

登陆 node2 查看服务器存储信息,目前空间还很充足。

ceph 集群异常导致K8S的pod异常

集群使用到的分布式存储为ceph,因此查看ceph集群状态。

ceph 集群异常导致K8S的pod异常

目前查看到 ceph 集群异常,可能导致 node2 节点 cgroup 泄露异常,进行手动修复ceph集群。

三 操作

3.1 ceph修复

数据的不一致性(inconsistent)指对象的大小不正确、恢复结束后某副本出现了对象丢失的情况。数据的不一致性会导致清理失败(scrub error)。

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务,私聊QQ646634621或微信db_bao,谢谢!
ceph 集群异常导致K8S的pod异常后续精彩内容已被小麦苗无情隐藏,请输入验证码解锁本站所有文章
验证码:
请关注本站微信公众号,回复“小麦苗博客”,获取验证码。在微信里搜索“DB宝”或者“www_xmmup_com”或者微信扫描右侧二维码都可以关注本站微信公众号。

标签:

Avatar photo

小麦苗

学习或考证,均可联系麦老师,请加微信db_bao或QQ646634621

您可能还喜欢...

发表回复

嘿,我是小麦,需要帮助随时找我哦
  • 18509239930
  • 个人微信

  • 麦老师QQ聊天
  • 个人邮箱
  • 点击加入QQ群
  • 个人微店

  • 回到顶部