当前位置: 首页 > news >正文

管理OCR与Voting Disk(原创)

Voting Disk 概述 

Oracle Clusterware由2部分组成,分别是Voting Disk和 OCR。Voting Disk里面记录着节点成员的信息。如RAC数据库中有哪些节点成员,节点增加或者删除时也同样会将信息记录进来。Voting Disk必须存放在共享存储上,通常来说是存放在裸设备上。Voting Disk主要为了在出现脑裂时,决定那个Partion获得控制权,其他的Partion必须从集群中剔除。为了保证Voting Disk的安全,需要配置多个Voting Disk,Voting disk使用的是一种“多数可用算法”。当有多个Voting  disk时,则必须一半以上的Votedisk同时使用,Clusterware才能正常使用。 比如配置了4个Votedisk,坏一个Votedisk,集群可以正常工作,如果坏了2个,则不能满足半数以上,集群会立即宕掉,所有节点立即重启,所 以如果添加Votedisk,尽量不要只添加一个,而应该添加2个。Oracle建议Voting Disk的个数应该为奇数个,如 1、3、5个,每个Voting Disk的大小约为20MB。关于Voting Disk的更多内容,看参阅笔者的如下博客
http://czmmiao.iteye.com/blog/1577531

维护Voting Disk

注意:对Voting Disk的更改必须用root来进行,添加或删除Voting Disk都必须在crs资源关闭的情况下进行,同时即使在CRS关闭情况下仍然需要使用-force参数 
查看Voting Disk

# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2

备份Voting Disk 
#dd if=/dev/raw/raw2 f=/home/oracle/voting_disk.bak 
恢复Voting Disk 
#dd if=/home/oracle/voting_disk.bak f=/dev/raw/raw2

添加和删除Voting Disk

# raw -qa
/dev/raw/raw1:  bound to major 8, minor 17
/dev/raw/raw2:  bound to major 8, minor 33
/dev/raw/raw3:  bound to major 8, minor 58

# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

# ./crsctl add css votedisk /dev/raw/raw4 -force
Now formatting voting disk: /dev/raw/raw4
CLSFMT returned with error [4].
failed 9 to initailize votedisk /dev/raw/raw4.

# ./crsctl add css votedisk /dev/raw/raw3 -force
Now formatting voting disk: /dev/raw/raw3
successful addition of votedisk /dev/raw/raw3.
 
# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2
 1.     0    /dev/raw/raw4
 2.     0    /dev/raw/raw3
located 3 votedisk(s).
# ls -l /dev/raw/raw*
crw-rw---- 1 oracle oinstall   162, 1 Jan  1 20:19 /dev/raw/raw1
crw-rw---- 1 oracle oinstall   162, 2 Jan  1 20:18 /dev/raw/raw2
crw-rw---- 1 oracle oinstall   162, 3 Jan  1 20:22 /dev/raw/raw3
-rw-r--r-- 1 root   root     10240000 Jan  1 20:18 /dev/raw/raw4

可以看到在没有/dev/raw/raw4设备的情况下执行添加voting disk命令时,报错并在/dev/raw/目录下创建了raw4文件,我们必须删除该文件

# ./crsctl delete css votedisk /dev/raw/raw4 -force
successful deletion of votedisk /dev/raw/raw4.
# ls -l /dev/raw/raw*
crw-rw---- 1 oracle oinstall   162, 1 Jan  1 20:34 /dev/raw/raw1
crw-rw---- 1 oracle oinstall   162, 2 Jan  1 20:18 /dev/raw/raw2
crw-rw---- 1 oracle oinstall   162, 3 Jan  1 20:22 /dev/raw/raw3
-rw-r--r-- 1 root   root     10240000 Jan  1 20:18 /dev/raw/raw4
# rm -f /dev/raw/raw4 
# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2
 1.     0    /dev/raw/raw3
located 2 votedisk(s).

OCR概述

OCR 负责维护整个集群的配置信息,包括RAC以及Clusterware资源,包括的信息有节点成员、数据库、实例、服务、监听器、应用程序等。为了解决集群 的“健忘”问题,整个集群会有一份配置OCR,最多两分OCR,一个primary OCR和一个mirror OCR互为镜像,以防OCR的单点故障。关于“健忘”可以参阅笔者的

http://czmmiao.iteye.com/admin/blogs/1629166

ORACLE 把集群的配置文件放在共享存储上叫做OCR DISK。 节点通过OCR Process读写OCR。 但只有一个节点能够读写OCR DISK 叫OCR Master节点,其它节点通过本节点的OCR process 向master node的OCR process提交请求,由master OCR Process完成物理读写,并同步所有节点OCR cache中的内容。就OCR而言,每个集群都会有一个Master节点,这个节点一半来说是集群中生存时间最长的那个节点(生存时间最长也就意味着该节 点越稳定)。
我们在安装Clusterware的在选择OCR的存储位置时,如果选择"Normal Redundancy",则会存储两份相互镜像的OCR。如果选择"External Redundancy"则表明存储本身已经坐了冗余配置,不需要创建镜像OCR。该位置会记录在/etc/oracle/ocr.loc(Linux)或 /var/opt/oracle/ocr.loc(Solaris)中。
OCR存储的配置信息是以目录树的形式来记录一系列“键-值”对应信息 的。OCR记录着 CRS进程管理资源的所有配置信息,大小约为100MB。OCR key:有3个大分支,分别是SYSTEM.css,DATABASE 和CRS。每个分支下面又有许多小分支。这些记录的信息只能由root用户修改。 

由于 OCR的信息十分重要,Oracle会每4小时队其做一次备份,并且保留最后的3个备份,以及前一天、前一周的最后一个备份。这个备份由Master Node的CRSD进程完成,备份的默认位置为$CRS_HOME/crs/cdata/<cluster_name>目录下。每次备份后, 备份文件的名字会自动变更,以反映备份时间顺序,最近一次备份叫做backup00.ocr。建议DBA除了在本地保留这些备份外,还应在其他存储设备上 保留一份备份,以防止意外的存储故障。

ocrdump 
如果想阅读ocr信息,可以使用ocrdump命令将OCR的内容以ASCII的方式打印出,但是这个命令不能用作OCR的备份恢复,只能用作阅读,
命令格式:ocrdump [-stdout] [filename] [-keyname name] [-xml]
参数说明:
-stdout:把内容打印输出到屏幕上
Filename:内容输出到文件中
-keyname:只打印某个键及其子健内容
-xml:以xml格式打印输出
示例:把system.css键的内容以.xml格式打印输出到屏幕
#./ocrdump -stdout -keyname SYSTEM.css -xml|more 
这个命令在执行过程中,会在$CRS_HOME\log\<node_name>\client目录下产生日志文件,文件名ocrdump_<pid>.log,如果命令执行出现问题,可以从这个日志查看问题原因。

ocrcheck 
Ocrcheck命令用于检查OCR内容的一致性,命令执行过程会在$CRS_HOME\log\nodename\client目录下产生ocrcheck_<pid>.log日志文件。 这个命令不需要参数。

#./ocrcheck
Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4348
         Available space (kbytes) :     159320
         ID                       : 1345945283
         Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded

                                    Device/File not configured

         Cluster registry integrity check succeeded

ocrconfig

查看自动备份信息

#./ocrconfig -help

$ ocrconfig -showbackup
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/18 21:12:37     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao1     2012/12/16 21:54:20     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs

$ ls -l /u01/app/oracle/product/10.2.0/db_1/cdata/crs
total 29880
-rw-r--r-- 1 root   root     5083136 Dec  7 16:05 backup00.ocr
-rw-r--r-- 1 root   root     5083136 Nov 27 19:14 backup01.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 backup02.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 day.ocr
-rw-r--r-- 1 oracle oinstall   22084 Jan  1 20:52 OCRDUMPFILE
-rw-r--r-- 1 root   root     5083136 Dec 16 21:54 temp.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 week.ocr

使用导出,导入进行备份和恢复 
Oracle推荐在对集群做调整时,比如增加,删除节点之前,应该对OCR做一个备份,可以使用export备份到指定文件,如果做了replace或者restore等操作,Oracle建议使用cluvfy comp ocr -n all命令来做一次全面的检查。

# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources 
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

# ./ocrconfig -export ocrexp.exp       #导出ocr 
# ls -l ocrexp.exp 
-rw-r--r-- 1 root root 102935 Jan  1 21:17 ocrexp.exp

# ./crsctl start crs
Attempting to start CRS stack 
The CRS stack will be started shortly

# dd if=/dev/zero of=/dev/raw/raw1 bs=1M        #破坏ocr

dd: writing `/dev/raw/raw1': No space left on device
160+0 records in
159+0 records out
167685120 bytes (168 MB) copied, 18.0218 seconds, 9.3 MB/s
# ./ocrcheck
PROT-601: Failed to initialize ocrcheck
# ./runcluvfy.sh comp ocr -n all
Verifying OCR integrity
Unable to retrieve nodelist from Oracle clusterware.
Verification cannot proceed.
# ./ocrconfig -import ocrexp.exp 
       #导入ocr

# ./ocrcheck
# ./runcluvfy.sh comp ocr -n all

移动和删除OCR

移动OCR时,不能直接修改OCR,必须要先添加镜像才能修改,否则会报错

# ./ocrconfig -replace ocr /dev/raw/raw3
PROT-1: Failed to initialize ocrconfig

# ./ocrconfig -replace ocrmirror /dev/raw/raw3        #创建镜像ocr

# ./ocrcheck
Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4344
         Available space (kbytes) :     159324
         ID                       :   38625139
         Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded
         Device/File Name         : /dev/raw/raw3
                                    Device/File integrity check succeeded
         Cluster registry integrity check succeeded

# cat /etc/oracle/ocr.loc 
#Device/file /dev/raw/raw3 getting replaced by device /dev/raw/raw3 
ocrconfig_loc=/dev/raw/raw1
ocrmirrorconfig_loc=/dev/raw/raw3
 
# ./ocrconfig -replace ocr /dev/raw/raw4        #修改primary ocr位置

# ./ocrcheck

Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4344
         Available space (kbytes) :     159324
         ID                       :   38625139
         Device/File Name         : /dev/raw/raw4
                                    Device/File integrity check succeeded
         Device/File Name         : /dev/raw/raw3
                                    Device/File integrity check succeeded
         Cluster registry integrity check succeeded

# ./ocrconfig -replace ocrmirror               #删除镜像ocr

# cat /etc/oracle/ocr.loc 
#Device/file /dev/raw/raw3 being deleted 
ocrconfig_loc=/dev/raw/raw4


参考至:《大话Oracle RAC》张晓明著
               http://blog.csdn.net/inthirties/article/details/5431368
               http://blog.csdn.net/tianlesoftware/article/details/6049378

本文原创,转载请注明出处、作者
如有错误,欢迎指正
邮箱:czmcj@163.com

作者:czmmiao  文章出处:http://czmmiao.iteye.com/blog/1758360

相关文章:

  • Open-E DSS V7 应用系列之十 主动/主动 iSCSI群集部署(二)
  • ThinkSNS特有需求之--英文字符占 0.5 个,中文字符占 1 个
  • Java 加密解密基础
  • HTML5边玩边学(9):俄罗斯方块就是这么简单 之 数据模型篇
  • PAT (Advanced Level) 1045. Favorite Color Stripe (30)
  • Web安全实践(15)CSRF(跨站请求伪造)-从校内的插入图片说起
  • CCAction
  • Wireshark漫谈(一)
  • 手写数字识别的几种实现方法
  • POJ1015 Jury Compromise(DP)
  • React 的慢与快:优化 React 应用实战
  • required 引发的小小思考
  • Python cos() 函数
  • [数据结构] 冒泡排序
  • NIPT无创产前分析思路
  • (十五)java多线程之并发集合ArrayBlockingQueue
  • [case10]使用RSQL实现端到端的动态查询
  • ES6, React, Redux, Webpack写的一个爬 GitHub 的网页
  • java中具有继承关系的类及其对象初始化顺序
  • js操作时间(持续更新)
  • leetcode388. Longest Absolute File Path
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • supervisor 永不挂掉的进程 安装以及使用
  • ubuntu 下nginx安装 并支持https协议
  • Vue2 SSR 的优化之旅
  • zookeeper系列(七)实战分布式命名服务
  • 从tcpdump抓包看TCP/IP协议
  • 分享一份非常强势的Android面试题
  • 机器学习中为什么要做归一化normalization
  • 简单基于spring的redis配置(单机和集群模式)
  • 前端面试之CSS3新特性
  • 前嗅ForeSpider采集配置界面介绍
  • 【干货分享】dos命令大全
  • Play Store发现SimBad恶意软件,1.5亿Android用户成受害者 ...
  • ​Java并发新构件之Exchanger
  • # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #mysql 8.0 踩坑日记
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (9)YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO
  • (aiohttp-asyncio-FFmpeg-Docker-SRS)实现异步摄像头转码服务器
  • (附源码)springboot 基于HTML5的个人网页的网站设计与实现 毕业设计 031623
  • (力扣)循环队列的实现与详解(C语言)
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • .net 8 发布了,试下微软最近强推的MAUI
  • .net core IResultFilter 的 OnResultExecuted和OnResultExecuting的区别
  • .Net Core缓存组件(MemoryCache)源码解析
  • .NET Framework 3.5中序列化成JSON数据及JSON数据的反序列化,以及jQuery的调用JSON
  • .Net FrameWork总结
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .net 中viewstate的原理和使用
  • .net/c# memcached 获取所有缓存键(keys)
  • .Net多线程总结