去年10月份接手一个12.2 RAC环境,使用crsctl status res -t查看,发现有个实例状态是UNKNOWN。一直都没有停机维护时间,在测试环境中也没有模拟不出来,原以为删除实例再添加可以解决了。就一直等待维护机会来处理,
+ASM1:/home/grid@hydb1>crsctl status res -t
今天客户要求在该环境上新加一个实例,应付一些应用急需使用。就dbca创建hyoa实例,到最后报错了,截图如下,节点一看样子还是有问题的。可以手动启动实例,无法使用srvctl,但是监听中没有,
+ASM1:/home/grid@hydb1>crsctl status res -t 查看,新建的实例也成了UNKNOWN
以为是listener的问题,一查看节点一确实不正常,赶紧修改,但修改监听可以看到的,但还是无法srvctl启动。
SYS@hyoa1> alter system set local_listener='(ADDRESS=(PROTOCOL=TCP)(HOST= 172.100.20.113)(PORT = 1521))' sid='hyoa1';
SYS@hyoa1> alter system set remote_listener='hydb-scan:1521' sid='hyoa1';
继续排查,想到删除实例并添加实例,操作后还是无法使用srvctl启动
hyoa1:/home/oracle@hydb1>srvctl remove instance -d hyoa -i hyoa1
Remove instance from the database hyoa? (y/[n]) y
hyoa1:/home/oracle@hydb1> srvctl add instance -d hyoa -i hyoa -n hydb1
使用srvctl的报错如下
hyoa1:/home/oracle@hydb1>srvctl start instance -d hyoa -i hyoa1
PRCR-1013 : Failed to start resource ora.hyoa.db
PRCR-1064 : Failed to start resource ora.hyoa.db on node hydb1
CRS-2680: Clean of 'ora.hyoa.db' on 'hydb1' failed
CRS-5802: Unable to start the agent process
查看mos吧,确实是节点一上权限问题
'srvctl start database' Fails With 'CRS-5802: Unable to start the agent process' as the Agent Log is Owned by Wrong User (Doc ID 1957360.1)
[root@hydb1 ~]# chown oracle:oinstall crsd_oraagent_oracleOUT.trc
[root@hydb1 ~]# chown oracle:oinstall crsd_oraagent_oracle.pid