- 论坛徽章:
- 4
|
日前,解决了一个SUN L8的小故障。因为平时很少用带库,故记下来,权作笔记,也欢迎网友参考指正。
一、环境:
sun 480v双机
sun 3510阵列
sun L8带库
solaris 9 + SVM + sun cluster
oracle 9i
NBU 5.0 GA
备份模式:
数据库每日一次全备,4次归档备份
NBU配置模式:
L8 scsi连接host2
host2做NBU的master server和media server, host1为NBU的client
当前业务跑在host1上,rman备份数据,由NBU控制,经局网传到连接host2的L8上。
L8中放了8盘磁带,7盘数据库,1盘清洗带,8盘带全属于一个卷组。7盘数据带分两部分应用,6盘用于oracle卷池,1盘用于备用卷
池(暂无实际应用)。
二、故障现象:
L8的4个LED灯,自左数3个灯都常亮,包括清洗灯(clean),介质故障灯(media attention)。第4个灯,严重故障灯(error)未亮
。
L8面板LCD显示,slot 7介质有问题,提示"!"。
三、分析:
可能是驱动器需要清洗了。
可能是slot 7上的磁带有问题(已经买了几年的旧带,最近一两个月才真正启用)
可能是其它更严重的故障
……
四、预定解决方案:
前提:
1. 客户没有可用于更换的新的数据带
2. 客户有新的清洗带,但带到现场的是没有标签(条码)的(标签早丢了)
步骤:
1. 清洗驱动器。先NBU内控制清洗;不行的话,再用L8面板控制清洗;再不行的话,更换无标签的清洗带,尝试识别(robot
ivnentory),再并清洗
2. 在NBU中删除损坏的磁带,卸载故障磁带
3. 重启L8,自检测试,再试用。如还有问题,向厂家硬件报障并更换。
五、实际操作步骤:
1. 检查NBU备份状态
每日备份状态一切正常。
因为是才启用的磁带备份,数据库又很小,全库备份才600MB,磁带容量200G/盘(压缩后400G),目前实际只用了slot 5上的磁带
,即所有数据都在slot 5的带上。故障的slot 7上的磁带属于oracle卷池中的一盘数据带,当前未含有有效数据。
2. 检查NBU报告和介质状态
只发现了一次明显介质相关错误(I/O读写失败),与slot 7磁带有关。
驱动器上的mount记录,绝大部分集中在slot 5的带上(实际备份只用到它了,同池其它带还没来得及循环使用),其它带子基本没
有被mount过,或只有2-3次左右的mount,目前总共已备份数据超过33G。
3. 暂停所有备份策略
将所有atcive备份的策略deactive
3. 在NBU中清洗驱动器
第一次清洗操作不能启动。
检查发现当前剩余清洗次数已为0,手工调整到10,再尝试清洗后,清洗灯熄灭,介质故障灯仍然常亮。
(注:这种清洗带理论上支持50次清洗,现在剩余次数为0,也不知是已清洗过50次(或原指定次数),还是原来的设置有问题,未
详查)
4. 重复清洗
根据L8的手册提示,介质故障灯如果常亮,也可能是清洗的次数不够,建议重复清洗3次以上,重复清洗了3次,此灯仍亮,判定介
质有问题。
(注:之前未启用备份时,原带就曾更换过几盘,这些数据带都年头过久,不太可靠)
5. 删除并卸载故障磁带
在NBU oracle卷池中删除了故障带。
停止了NBU介质管理器后台进程。(注:相关专家提示没有这个必要,但我为了保险,还是停掉了,因为我不清楚NBU对L8的控制程
度如何,下一步操作是要操作L8硬件,担心给NBU介质管理器造成混乱)
面板操作L8,取出了故障带,介质故障灯随之熄灭。
6. 重启NBU介质管理器后台进程,检查NBU相关配置
重启介质管理器后台进程,检查了NBU硬件配置,一切正常。oracle卷池现剩余5盘带,编目信息(robot inventory)与实际信息符
合,没有update的很必要。
注意:重启介质管理器后台进程后,NBU中显示进程启动成功,但还要等一段时间,才能成功地执行robot inventory操作,查询介
质相关信息;否则会没有任何信息提示,这并非介质管理器故障。
7. 重启备份策略
重新active所有当前deactive的备份策略
六、结论
驱动器需要清洗了。通过清洗,解决了清洗灯常亮的问题。
slot 7中的磁带坏了。通过删除和卸载,解决了介质故障灯常亮的问题。
因为没有新的数据带,所以没有做更换操作。
因为新的清洗带没有标签(barcode),也就不尝试更换清洗带了,待以后巡检时再检查。如果介时重复清洗故障,并且旧清洗带不
再起作用,再考虑更换。
另,操作中发现NBU中的eject功能不支持L8带库,可能是L8太低档了吧。L8名为带库(tape library),实际上更准确的称呼是自
动加裁机(autoloader),算是一种廉价带库。这种产品应该也不是SUN原产的,可能是OEM HP的。
再另,sun官方网站不提供任何L8的操作手册资料,我是从其它站点找到的资料,当然这些资料是加了sun标识的。 |
-
drempty.gif
(24.23 KB, 下载次数: 156)
"-" 表示指定槽位无磁带,"!"表示指定槽位的磁带可能故障
-
drload.gif
(35.77 KB, 下载次数: 144)
"■"表示指定槽位的磁带正加裁在驱动器中
|