当前位置: 首页 > news >正文

AIX 5.3下Oracle 10g RAC 启动故障--vip漂移

系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1

系统架构图


wKioL1NspizDELFmAAFqCT5td6k065.jpg


故障现象:

系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE。

[root@aix213 racg] cat /etc/hosts

1
2
3
4
5
6
7
8
127.0 . 0.1                loopback localhost      # loopback (lo0) name/address
192.168 . 8.214    aix214
192.168 . 8.106    aix106
192.168 . 8.213    aix213
192.168 . 8.115    aix213-vip
10.10 . 10.213     aix213-priv
192.168 . 8.113    aix214-vip
10.10 . 10.214     aix214-priv

每个node都绑定了其他节点的vip ip ,vip ip address 绑定到了所有的节点上!

[oracle@aix214 ~]$ifconfig -a

1
2
3
4
5
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
        inet  192.168 . 8.214  netmask  0xffffff00  broadcast  192.168 . 8.255
inet  192.168 . 8.113  netmask  0xffffff00  broadcast  192.168 . 8.255
         inet  192.168 . 8.115  netmask  0xffffff00  broadcast  192.168 . 8.255
         tcp_sendspace  131072  tcp_recvspace  65536  rfc1323  0

[oracle@aix213 ~]$ifconfig -a

1
2
3
4
5
en0: flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),PSEG,LARGESEND,CHAIN>
        inet  192.168 . 8.213  netmask  0xffffff00  broadcast  192.168 . 8.255
   inet  192.168 . 8.113  netmask  0xffffff00  broadcast  192.168 . 8.255
         inet  192.168 . 8.115  netmask  0xffffff00  broadcast  192.168 . 8.255
         tcp_sendspace  131072  tcp_recvspace  65536  rfc1323  0

[root@aix214 /]$crsctl check crs

1
2
3
CSS appears healthy
CRS appears healthy
EVM appears healthy

[root@aix214 /]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora... .13. lsnr application    ONLINE    OFFLINE
ora.aix213.gsd application    ONLINE    OFFLINE
ora.aix213.ons application    ONLINE    OFFLINE               
ora.aix213.vip application    ONLINE    OFFLINE               
ora... .14. lsnr application    ONLINE    OFFLINE               
ora.aix214.gsd application    ONLINE    OFFLINE               
ora.aix214.ons application    ONLINE    OFFLINE               
ora.aix214.vip application    ONLINE    OFFLINE               
ora.prod.db    application    ONLINE    OFFLINE               
ora....d1.inst application    ONLINE    OFFLINE               
ora....d2.inst application    ONLINE    OFFLINE

查看日志

[root@aix213 racg]cd /u01/crs_1/log/aix213/racg

1
2
3
4
5
6
7
8
9
10
11
12
13
[root @aix213  racg]$more ora.aix213.vip.log
Oracle Database 10g CRS Release  10.2 . 0.1 . 0  Production Copyright  1996 2005  Oracle.  All rig
hts reserved.
2014 - 05 - 09  17 : 07 : 05.624 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: Invalid parameters, or 
failed to bring up VIP (host=aix213)
2014 - 05 - 09  17 : 07 : 05.624 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: env ORACLE
_CONFIG_HOME=/u01/crs_1
2014 - 05 - 09  17 : 07 : 05.625 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: cmd = /u01
/crs_1/bin/racgeut -e _USR_ORA_DEBUG= 0  54  /u01/crs_1/bin/racgvip start aix213
2014 - 05 - 09  17 : 07 : 05.625 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: clsrcexecut: rc =  1 , ti
me =  0 .345s
2014 - 05 - 09  17 : 07 : 06.832 : [    RACG][ 1 ] [ 385112 ][ 1 ][ora.aix213.vip]: Invalid parameters, or 
failed to bring up VIP (host=aix213)

......

初步判断是在节点上VIP配置有问题

解决方法1:

1、关闭所有node上的nodeapps

[oracle@aix213 ~]$srvctl stop nodeapps -n  aix213

[oracle@aix213 ~]$srvctl stop nodeapps -n  aix214

[oracle@aix213 ~]$srvctl modify nodeapps  -A 192.168.8.115/255.255.255.0/en0 -n aix213 -o $ORACLE_HOME

[oracle@aix213 ~]$srvctl modify nodeapps  -A 192.168.8.113/255.255.255.0/en0 -n aix214 -o $ORACLE_HOME

2、停止所有节点的crs

[oracle@aix213 ~]$crsctl stop  crs

[oracle@aix214 ~]$crsctl stop crs

3、重新启动所有节点的crs

[oracle@aix213 ~]$crsctl start  crs

[oracle@aix214 ~]$crsctl start crs

解决方法2:

1、更新CRS中VIP信息

[root@aix213 racg] cat /etc/hosts

1
2
3
4
5
6
7
8
127.0 . 0.1                loopback localhost      # loopback (lo0) name/address
192.168 . 8.214    aix214
192.168 . 8.106    aix106
192.168 . 8.213    aix213
192.168 . 8.115    aix213-vip
10.10 . 10.213     aix213-priv
192.168 . 8.113    aix214-vip
10.10 . 10.214     aix214-priv

2、修改VIP

1
2
3
[root @aix214  /]$srvctl modify nodeapps -n aix213 -o /u01/app/oracle/product/ 10.2 . 0 /db_1/ -A  192.168 . 8.115 / 255.255 . 255.0 /en0
 
[root @aix214  /]$srvctl modify nodeapps -n aix214 -o /u01/app/oracle/product/ 10.2 . 0 /db_1/ -A  192.168 . 8.113 / 255.255 . 255.0 /en0

3、以root身份执行vipca

wKioL1NsqdfwzjktABaoQqgmyBY106.jpg


4、重新启动CRS服务

1
2
3
4
[root @aix214  /]$crsctl check crs
CSS appears healthy
CRS appears healthy
EVM appears healthy

[root@aix214 /]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.... 13 .lsnr application    OFFLINE   OFFLINE               
ora.aix213.gsd application    ONLINE    ONLINE    aix213      
ora.aix213.ons application    ONLINE    ONLINE    aix213      
ora.aix213.vip application    ONLINE    ONLINE    aix213      
ora.... 14 .lsnr application    ONLINE    OFFLINE               
ora.aix214.gsd application    ONLINE    ONLINE    aix214      
ora.aix214.ons application    ONLINE    ONLINE    aix214      
ora.aix214.vip application    ONLINE    ONLINE    aix214      
ora.prod.db    application    ONLINE    OFFLINE               
ora....d1.inst application    OFFLINE   OFFLINE               
ora....d2.inst application    ONLINE    OFFLINE

手工启动Listener service:

1
2
3
4
5
6
7
8
9
10
11
[root @aix214  /]$crs_stat |grep lsn
NAME=ora.aix213.LISTENER_AIX213.lsnr
NAME=ora.aix214.LISTENER_AIX214.lsnr
 
[root @aix214  /]$crs_start -f ora.aix214.LISTENER_AIX214.lsnr
Attempting to start `ora.aix214.LISTENER_AIX214.lsnr` on member `aix214`
Start of `ora.aix214.LISTENER_AIX214.lsnr` on member `aix214` succeeded.
 
[root @aix214  /]$crs_start -f ora.aix213.LISTENER_AIX213.lsnr
Attempting to start `ora.aix213.LISTENER_AIX213.lsnr` on member `aix213`
Start of `ora.aix213.LISTENER_AIX213.lsnr` on member `aix213` succeeded.

至此CRS启动成功:

[oracle@aix213 ~]$crs_stat -t

1
2
3
4
5
6
7
8
9
10
11
12
13
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.... 13 .lsnr application    ONLINE    ONLINE    aix213      
ora.aix213.gsd application    ONLINE    ONLINE    aix213      
ora.aix213.ons application    ONLINE    ONLINE    aix213      
ora.aix213.vip application    ONLINE    ONLINE    aix213      
ora.... 14 .lsnr application    ONLINE    ONLINE    aix214      
ora.aix214.gsd application    ONLINE    ONLINE    aix214      
ora.aix214.ons application    ONLINE    ONLINE    aix214      
ora.aix214.vip application    ONLINE    ONLINE    aix214      
ora.prod.db    application    ONLINE    ONLINE    aix213      
ora....d1.inst application    ONLINE    ONLINE    aix213      
ora....d2.inst application    ONLINE    ONLINE    aix214

@至此,问题基本解决










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1408998,如需转载请自行联系原作者

相关文章:

  • Tomcat配置——中文显示
  • 2017-2018 ACM-ICPC Nordic Collegiate Programming Contest (NCPC 2017)
  • Struts2总结
  • 数组扁平化
  • Lucene学习总结之二:Lucene的总体架构
  • [SHELL]shell scripts笔记(1)
  • 我所认识的git
  • Jmeter入门--性能测试实战
  • 缓存导致上线后,访问404
  • 学习笔记TF060:图像语音结合,看图说话
  • Win server 2012 R2 文件服务器--(二)权限设置
  • Ubuntu14.04下编译安装或apt-get方式安装搭建Apache或Httpd服务(图文详解)
  • 链接静态库的顺序问题
  • 设计模式命令
  • 垃圾回收机制及析构器原理解析
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 【css3】浏览器内核及其兼容性
  • 11111111
  • 8年软件测试工程师感悟——写给还在迷茫中的朋友
  • create-react-app做的留言板
  • es6--symbol
  • iOS帅气加载动画、通知视图、红包助手、引导页、导航栏、朋友圈、小游戏等效果源码...
  • Java小白进阶笔记(3)-初级面向对象
  • MySQL数据库运维之数据恢复
  • Redis 懒删除(lazy free)简史
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • SpiderData 2019年2月16日 DApp数据排行榜
  • spring + angular 实现导出excel
  • 从重复到重用
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • [Shell 脚本] 备份网站文件至OSS服务(纯shell脚本无sdk) ...
  • zabbix3.2监控linux磁盘IO
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • (1)STL算法之遍历容器
  • (1)虚拟机的安装与使用,linux系统安装
  • (day 2)JavaScript学习笔记(基础之变量、常量和注释)
  • (附源码)基于SpringBoot和Vue的厨到家服务平台的设计与实现 毕业设计 063133
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (区间dp) (经典例题) 石子合并
  • (三)Honghu Cloud云架构一定时调度平台
  • (淘宝无限适配)手机端rem布局详解(转载非原创)
  • (转)Sql Server 保留几位小数的两种做法
  • .net core 6 集成和使用 mongodb
  • .net解析传过来的xml_DOM4J解析XML文件
  • .NET企业级应用架构设计系列之应用服务器
  • .Net下使用 Geb.Video.FFMPEG 操作视频文件
  • .NET中winform传递参数至Url并获得返回值或文件
  • /run/containerd/containerd.sock connect: connection refused
  • /usr/bin/perl:bad interpreter:No such file or directory 的解决办法
  • [16/N]论得趣
  • [2019.3.20]BZOJ4573 [Zjoi2016]大森林
  • [ai笔记3] ai春晚观后感-谈谈ai与艺术
  • [Angular] 笔记 16:模板驱动表单 - 选择框与选项
  • [Bada开发]初步入口函数介绍