ChinaUnix首页 > 精华文章 > HP-UX > 正文

[精华] [亲身经历]更换VA 7100阵列控制器过程全记录


http://www.chinaunix.net 作者:netzh  发表于:2008-05-20 09:50:08
发表评论】 【查看原文】 【HP-UX讨论区】【关闭

症状为阵列2号控制器亮controller黄灯,根据经验一看就知道2号控制器挂了。今天的任务是要帮客户更换7100的控制器。

1、备份ORACLE数据库(1个全库exp+1个全库冷备份)
2、备份阵列盘上其他的文件系统和LUN、VG、PV、LV的名称和大小等信息。其实就是把diskinfo,ioscan,vgdisplay等命令结果保存下来。
3、umount 所有文件系统,vgchange -a n 所有阵列上的VG。这步非常重要,强烈建议。
4、VA7100支持热插拔和shutdown后更换两种方式,我用的热插拔方式,service guide里说用后者可能使阵列无法启动。
5、阿拉小心换下已牺牲的2号磁盘控制器(热插拔),等了两分钟插上新控制器,阵列上正常的那块控制器FW是HP19的版本,service guide上说HP14以后的版本都会自动去同步FW。于是等了20多分钟,客户都等的着急了,2号控制器的DIMM1指示灯仍迟迟不亮,无法用console连上,看来service guide里面说的也不能全信。
6、我用armmgr -R full方式reset控制器以后发现,1号控制器VFP有报错,mismatch code等,而且根据VFP信息代码看出新控制器是HP14的版本,^_^|能看到错误是比较幸运的总比它闷声不吭的好。
7、自动同步不行干脆那咱就手工同步,armdownload -M M/C1同步等了240秒以后它有给了我一个沉重的打击,只报了一行failed。晕倒~既然如此不给面子那俺准备要下毒手了,执行阵列正常shutdown,armmgr -s shut,
用HP14版本的控制器启动阵列,然后手工用FW文件升级为HP19,虽然风险比较大,不过只要阵列正常shutdown,map信息就都在硬盘上,再说数据也已经备份过了,不用担心那么多。
8、说作就作,换的过程就不罗嗦了,单用这块的话控制器就顺利通过了自检,DIMM1灯亮起来了,而且可以用console连上,armdiscover 以后建议用cvui升级固件,很简单照着提示作就行了。
9、搞定这个控制器以后插上另一块HP19的控制器,^_^终于正常了。不过很快又郁闷了,阵列关了以后再开console提示NO MAP,Vfpdsp -f看结果Disk都是noinclude,faint~,不过理论是实践的基础,反正map在磁盘上有备份,直接vfprecover,等了几分钟,阵列自动重启,这下vfpdsp –f正常了。
10、不过系统还是不能用阵列的lun,重新ioscan也不行,干脆两台主机重启,重启后lun已经认出来了,然后激活vg,mount fs,启动oracle,一切正常。^_^|


需要注意的地方:1、如果需要更换cache,首先拆下控制器电池,放置2分钟以上再去更换控制器cache
                        2、热插拔的时候注意不要碰到板子下面
                3、阵列控制器或填充板被移出不要超过5分钟。
                4、如果正常的给阵列断电,必须同时断开阵列后面两个电源插头

原文请访问我的Blog:http://blog.itpub.net/category/152/329



 feiaix 回复于:2005-05-31 08:48:31

顶,楼主辛苦了,谢谢,

楼主哪有service guide 可不可以共享一下呀,非常感谢


 李放 回复于:2005-05-31 09:52:50

非常感谢楼主的辛勤劳动


 khinese 回复于:2005-05-31 21:48:58

顶一下!


 ilwxfe 回复于:2005-06-01 08:51:23

楼主,能不能告诉我你的是什么牌子的服务器??
ibm还是HP


 robert 回复于:2005-06-01 09:36:54

HP9000


 dman_lou 回复于:2005-06-01 14:42:39

不是叫service notes吗?怎么现在hp改叫service guide了? :shock:


 netzh 回复于:2005-06-02 01:35:03

引用:原帖由 "feiaix" 发表:
顶,楼主辛苦了,谢谢,

楼主哪有service guide 可不可以共享一下呀,非常感谢



用我实践+翻译好的不是更好么? :em22:


 wgd77 回复于:2005-06-03 16:23:35

很好的经验,但没做过,有些晕!


 聪明笨小孩 回复于:2005-06-08 09:55:59

感觉很好 长见识


 digital_boy 回复于:2005-06-10 09:42:49

不错!学习学习


 david5337 回复于:2005-06-10 10:26:11

支持。
这样的东东不顶,还要顶什么哦?!


 Sonicant 回复于:2005-09-09 19:15:11

好文啊,楼主胆大心细,佩服!


 netzh 回复于:2005-09-15 23:47:24

谢谢!过奖了


 笑别离 回复于:2005-09-16 17:15:52

不错不错,楼主厉害
要顶


 jonfan 回复于:2005-09-19 17:14:09

觉得不错


 ls100 回复于:2005-09-20 20:42:14

service guide是一本对相应机器进行各种说明的手册;
service notes是为了增强系统可靠性的一些操作!


 二手硬盘 回复于:2005-09-21 17:21:39

报DOA 直接找个HP13的备件换


 feiaix 回复于:2005-11-17 13:37:21

报DOA 直接找个HP13的备件换 ???

 请问楼住DOA是什么?在哪能找到HP13控制器呀?


 lu407 回复于:2005-11-18 14:36:58

控制器换得太多,好像没碰到这么麻烦的
一般插上去2分钟就正常了,最多需要update光纤链路。。
看来楼主比较衰。。
而且有时候从硬盘读回map表会失败,建议还是严格按service manual操作。。


 ipod 回复于:2005-11-18 19:40:58

引用:原帖由 dman_lou 于 2005-6-1 14:42 发表
不是叫service notes吗?怎么现在hp改叫service guide了? :shock: 


晕!这是两个完全没有关系东西.


 kluso 回复于:2005-12-05 16:22:26

hp的东西换硬盘的话
我不换
找公司咯
哈哈,不过还是先保存把


 servernet 回复于:2005-12-05 17:02:02

换过不下于 30个


 IWait 回复于:2005-12-05 17:35:38

楼主看来是个高手,不过好象对HP-UX不熟悉.
实际上你换完Controller后LUN不能被主机访问,不需要重新启动主机,只需要
dmesg或者看syslog就知道光纤链路有问题,使用
fcmsuti做一下就可以了.l


 inhance 回复于:2005-12-09 15:37:22

顶一顶


 david5337 回复于:2005-12-10 09:22:20

顶一下子哦


 lwq315 回复于:2006-01-11 09:18:39

好贴!经典!收藏!


 panghao 回复于:2008-05-16 12:19:25

说的太夸张,多安装几次就好了。但问题可能遇到更多,不信试试看。对了整机拆散过吗?


 暴虐づ金属天堂 回复于:2008-05-20 09:50:08

强贴留名,顶起收藏!




原文链接:http://bbs.chinaunix.net/viewthread.php?tid=553474
转载请注明作者名及原文出处