如果$GRID_HOME或$GRID_BASE或/u01目录下的所有文件权限被人为误操作修改了,那么如何来修复该权限问题?

0    139    1

Tags:

👉 本文共约2005个字,系统预计阅读时间或需8分钟。

权限被修改

如果使用chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录下的所有文件权限修改了,或者删除了Oracle 11g rac中$GRID_HOME/log文件夹下的所有内容,那么将导致集群不能正常启动。

误操作的命令如下所示:

可以通过命令“cluvfy comp software -n all -verbose”来校验集群的权限是否正确。

修复方法

大致可以通过如下几种方法来修复权限问题:

方法1:rootcrs.pl -init

根据MOS文档1931142.1提供的建议,可以通过root用户执行命令$GRID_HOME/crs/install/rootcrs.pl -init(11gR2 PSU>11.2.0.3.6的集群)或roothas.pl -init(11gR2 PSU>11.2.0.3.6的单实例)进行解决。对于Oracle 12c版本,需要将rootcrs.pl或roothas.pl修改为rootcrs.sh和roothas.sh。该方法可以用来解决删除了Oracle 11g rac中$GRID_HOME/log文件夹下的所有内容,导致集群不能启动的情况,但是,对于chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录的权限修改了的情况不一定能恢复。

需要注意的是,rootcrs.pl –init是在PSU>11.2.0.3.6下执行的,如果PSU<11.2.0.3.6,那么可以执行如下两条命令来实现同样的效果。

方法2:脚本permission.pl

采用MOS文档1515018.1上提供的脚本permission.pl在权限正常的节点上生成修复脚本,然后将生成的修复脚本在异常节点上执行来修复权限问题。可以用来修复chown -R误操作将整个$GRID_HOME或$GRID_BASE或/u01目录的权限修改了的情况。

permission.pl脚本的内容如下所示:

需要注意的是,该脚本会产生2个文件:

修复时只需要执行restore-perm-

修复目录/u01/app的过程如下所示:

该方法也是作者推荐的一种方法。

方法3:getfacl和setfacl

Linux环境中还可以通过getfacl和setfacl来恢复。

getfacl在权限正常的节点上获取权限,然后修改脚本中的主机名,最后使用setfacl恢复权限,如下所示:

该方法也是作者推荐的一种方法。

方法4:直接恢复重要文件夹的权限

直接恢复重要文件夹的权限,执行如下命令可以让集群先启动起来,但是,可能会隐藏一些未知的权限问题。如下所示:

需要注意的是,多数以pl结尾的脚本从12.1.0.2开始都变为了sh脚本,例如:rootcrs.pl需要修改为rootcrs.sh。

方法5:删除再添加节点

通过delete node,然后add node来恢复,但是这个过程相对过于复杂,但是或许是最保险的一种方式,Oracle也推荐这样。

方法6:使用crsconfig_fileperms和crsconfig_dirs

根据MOS文档:Tips for checking file permissions on GRID environment(ID 1931142.1)来修复该问题。在该文档中描述到,在$GRID_HOME/crs/utl(Oracle 11.2及12.1.0.1)或/crs/utl/(Oracle 12.1.0.2)下面的crsconfig_dirs和crsconfig_fileperms文件中记录了整个$GRID_HOME下面的文件和目录的相关权限。文件crsconfig_dirs记录了目录的权限,而文件crsconfig_fileperms记录了相关文件的权限。所以,可以使用crsconfig_fileperms和crsconfig_dirs文件中的信息手动更改权限。

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务,私聊QQ646634621或微信db_bao,谢谢!

方法7:root.sh

可以删除CRS的配置,然后重新运行root.sh即可。如果OCR和数据库不再同一个磁盘组里,那么重新运行root.sh脚本并不影响数据库,所以无需担心。可以用来修复OCR、OLR或表决磁盘损坏的情况,或ASM节点号和主机节点号不一致的情况。在deconfig之前,可以先将OCR的内容导出备份,然后等到root.sh执行成功后再将OCR的内容导入即可。常用的root.sh脚本执行过程参考:https://www.xmmup.com/oracle-raczhongxinzhixingroot-shjiaoben.html

方法8:重新安装

如果集群所有节点都遭到了破坏,那么也可以删除集群软件,通过重新安装集群软件的办法来解决,这也是最彻底修复问题的办法。当然,如果OCR和MGMT在单独的磁盘组中,那么重新安装软件并不会导致DATA和FRA磁盘组的数据丢失。在重新安装完集群软件后,只需要MOUNT磁盘组DATA和FRA即可。常用命令如下所示:

卸载rac请参考:https://www.xmmup.com/ruheshougongxiezaioracle-racjiqun.html

总结

在安装有GI的环境下,权限、属主是严格被设定的,任何对于它们的错误修改容易引发一系列的问题,而且这些问题往往都很诡异很难按照常规的思路去诊断。一旦出现权限的问题,个人建议第1、2、3、4种方式来修改。

标签:

头像

小麦苗

学习或考证,均可联系麦老师,请加微信db_bao或QQ646634621

您可能还喜欢...

发表回复

嘿,我是小麦,需要帮助随时找我哦
  • 18509239930
  • 个人微信

  • 麦老师QQ聊天
  • 个人邮箱
  • 点击加入QQ群
  • 个人微店

  • 回到顶部
返回顶部