LoveUnix » AIX -IBM UNIX » 菜鸟AIX成长日记-----与论坛的菜鸟们共勉*4月28日*
让LU留住您的每

一天 让LU博客留住您的每一天
2008-1-8 22:23 裸奔的孩子
菜鸟AIX成长日记-----与论坛的菜鸟们共勉*4月28日*

首先,晚上脑袋发热,想把自己每天的学习和实践的日志发上来。因为自己刚接触这个的时候几乎摸不到头脑,没有一个可以参考的学习流程,觉的任何事情都没头绪,所有把每天实践的日志发上来,老鸟们请帮忙指出错误,菜鸟们可以参考一下。也没别的意思,共同学习吧!来LU晃了这么多天了,也做点贡献吧~呵呵,日志都是很初级的东西,老鸟们不要笑哈!也希望大家可以把一些日志发上来共同学习。
   PS:有问题可以一起讨论,我刚接触这个才2个月整!我尽量每周更新3-4次,因为年底加班比较多。

   [color=Red][b]最重要的是:如果我写的又错误,请各位快速指出,丢面子事小,出事故事大![/b][/color]

*****************************************************************
                                            最近更新日志列表


[url=http://bbs.loveunix.net/thread-80597-1-1.html]1.  机器巡检基本知识 [/url]
[url=http://bbs.loveunix.net/thread-80597-1-1.html]2.  DS8000硬盘更换 [/url]
[url=http://bbs.loveunix.net/thread-80597-1-1.html]3.  630机器升级微码 [/url]
[url=http://www.loveunix.com/thread-80597-2-1.html]4.  DS4700硬盘的更换 [/url]
[url=http://www.loveunix.com/viewthread.php?tid=80597&pid=754809&page=3&extra=page%3D2#pid754809]5.  IBM  SVC虚拟存储的基本安装步骤[/url]
[url=http://bbs.loveunix.net/thread-80597-3-1.html]6.  DS4300的控制器电池更换 [/url]
[url=http://bbs.loveunix.net/thread-80597-4-1.html]7.  TakeOver方式的HACMP配置简单介绍 [/url]
[url=http://bbs.loveunix.net/thread-80597-5-1.html]8.  7133磁盘系统的坏盘更换步骤详解 [/url]
[url=http://bbs.loveunix.net/thread-80597-6-1.html]9.  【非技术】机器报修与维护基本操作流程[/url]
[url=http://bbs.loveunix.net/thread-80597-7-1.html]10.【技巧】多分区情况下的光驱NFS映射(DLPAER)[/url][color=red]New[/color]
[url=http://bbs.loveunix.net/thread-80597-8-1.html]11.【新方式】大家共同参与,写出个人经验和技巧共同进步![/url][color=red]New[/color]
[url=http://bbs.loveunix.net/thread-80597-10-1.html]12.  DS8000划盘详细操作第一讲 [/url]
[url=http://bbs.loveunix.net/thread-80597-11-1.html]13.  DS8000划盘详细操作第二讲 [/url]
*****************************************************************


[size=4][color=DarkSlateGray]2007年11月15日       机器巡检基本知识[/color][/size]

巡检一般又厂商或者代理商来做。
第一:首先是机房温度以及湿度的检查,当然这些一般情况都没问题。
         参考值:温度(摄氏 ℃)        10 ℃-40℃
                     湿度                           8% -80%
第二:就是关于电源的检测,这个只要不是新装机,一般没问题。
        参考值: 零-地电压        小于1V
                     火-地电压        200-240V
        补充:当然59系列的机器相间380V,相地240V。
第三:关于报错。


        主要查看硬件的永久性报错   [b]#errpt -dH | pg[/b]
                    软件的永久性报错   [b]#errpt -dS | pg[/b]

                    还有系统又没又报警灯(如果不正常,在后面的帖子将会细讲)
第三:机器的序列号:[b]#uname -Mu[/b]
第四:操作系统版本:[b]#oslevel -r[/b]      注:又时候不能使用是因为系统版本低的原因
第五:其他检测

执行[b]sysdumpdev –l [/b]检查dump是否设置为always allow sysdump
执行[b]sysdumpdev –e[/b]检查当前dump大小应该为主dump设备的大小的80%以下
执行[b]lsvg -l rootvg[/b]检查有否"stale"状态的逻辑卷
执行[b]lsps -s[/b]检查内存交换区占用情况
执行[b]df –k[/b]检查文件系统的分配状况,一般不要超过80%
执行[b]lsdev –Ccdisk[/b]检查硬盘状态为available
执行[b]lsdev –Ccadapter[/b]检查PCI卡状态为available
执行[b]lsdev –Cctape[/b]检查磁带机状态为available
执行[b]lsdev – Ccprocessor[/b]检查CPU状态为available
执行[b] lsattr –El sys0|grep autorestart[/b]  检查系统crash后是否自动重新启动
执行[b]lsattr –El sys0|grep cpuguard[/b]检查CPU GUARD是否开启
执行[b]lsattr –El mem0[/b]检查内存状态正常size=goodsize
执行 vmstat 2
iostat,topas观察us,sy,pi,po,内存占用率,硬盘读写速度等检查是否有性能瓶颈
执行[b]netstat –in[/b]和[b]netstat –rn[/b]观察网络状态
执行[b]entstat –d enX[/b]检测网卡运行速率与交换机速率是否匹配(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)
执行[b]ping[/b]命令检查网络连接状况
执行[b]lsdev –C|grep aio [/b] 检查异步IO是否可用
执行[b]lssrc –g cluster[/b]查看是否有三个进程均为active状态(这个主要看起了几个HA的进程了,有的时候是一个或两个)
执行[b]/usr/sbin/cluster/clstat –a[/b]查看cluster状态是否正常
检查/[b]etc/hosts[/b], 确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ip)
执行
[b]more /usr/es/adm/cluster.log
more /usr/es/sbin/cluster/history/*
cat /tmp/hacmp.out[/b]
检查这三个日志中是否有error或者fail.
检查7133面板上的指示灯,如果黄灯亮则需要诊断问题
HOTspare 磁盘检测
1、检查是否有raid保护 # smitty ssaraid--->List All Defined SSA RAID Arrays
2、检查是否有Hot Spare # smitty ssaraid--->List Components in a Hot Spare Pool
对于7133,执行Smitty ssaraid List All Defined SSA RAID Arrays查看7133 raid状态,正常应该为good状态。
对于7133,执行Smitty ssaraidChange/Show Use of an SSA Physical Disk查看7133硬盘状态,正常应该为member或者spare状态
对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。
记录检查结果

基本就是这些命令吧,如果我有遗漏后面继续补充。

对了,如果是华为和IBM的联合巡检就会多出几个项目:

cpu (主频*数量)    [b]#lsattr -El proc0[/b]
内置磁盘个数:  #lsdev -Ccdisk     
网卡信息:        #lsdev -Ccadapter
-------------------------------------------------------------------------------------------------------------
[size=4][color=DarkSlateGray]2007年11月27日       DS8300 硬盘更换 [/color][/size]

当前状况:DS8300硬盘损坏

首先要在HMC上查看具体的报错信息,一般会有多个,先看最早的,因为一般可能几个错误报的都是同一个硬盘的错误。
在报错中我们可以看见报错的Location Code,上面一般都是U****-D*-P*-T* 还有笼子号
顺着这个号找到错误的硬盘,DS8300有3个机柜,里面有控制台和两台570的是主柜,一般编号是D0,顺着就是D1\D2
每个笼子有16块硬盘,找到笼子以后按T后面的数字数就行了,这个是前话,因为这个时候你还不能把盘。

现在你在报错信息上面右键 Repair,(后面的步骤必须看清楚系统提示)然后弹出一个确认,你next,它就会提示说要切断该硬盘的电源,然后的界面不要急着NEXT,应该这里提示你更换后NEXT,这个时候也会弹出一个系统的帮助文件

现在你就可以拔硬盘了,正确的方法就是将卡扣拉松后等待70秒,然后硬盘角度微向上将硬盘慢慢抽出,这样可以避免将盘底部的电路划伤,在弹出的HELP上有图示。

然后插入新的硬盘,现在点NEXT,后面的基本就是漫长的等待了,大概2个小时左右会告诉你数据将会重建,如果有问题会CALL HOME等信息,关了走人就可以了,后面失败的几率很小了。

这个就是DS8300的换盘步骤,希望有错误请老鸟们提出,我好改正。
-----------------------------------------------------------------------------------------------------------------

*****************************************************************

[[i] 本帖最后由 裸奔的孩子 于 2008-4-28 15:23 编辑 [/i]]

2008-1-8 22:36 zhangwn
哈哈,头脑热得不错了
我也参考一下:D

2008-1-8 23:03 裸奔的孩子
[size=4][color=DarkSlateGray]2007年12月3日       630机器升级微码[/color][/size]

这次是要将一台630微码升级到07045这个版本。
首先下载微码了,这个不用说了,到IBM的网站上一步一步找就可以了。
下载完是一个70286C4F.BIN 的文件

然后在机器的  /tmp目录下新建 目录 /fwupdate  ,如果存在这个目录就一定要清空里面的内容,然后 把70286C4F.BIN 上传到这个目录。

Ftp的命令都会哈:
ftp
open ***.***.***.***
user/password
prompt          关回显
bin                二进制
lcd F:/
cd /tmp/fwupdate
mput 70286C4F.BIN
bye
-----------------------------------------------------------
升级前需要注意几个问题:
1.系统必须升级到5103版本以后
2.HMC的版本必须是3.12 或更高,我这里用KVM,所有不管这个事情

现在要确认客户已经停了所有业务,并且有除rootvg外其他的VG都没已经umount下去了。

确认OK后,如下:
#cd /tmp/fwupdate
#chmod +x 70286C4F.BIN           加上执行权限

#./70286C4F.BIN            解压缩
解压缩后会出来一个文件 3R070425.img
然后最好校验一下这个文件
#sum 3R070425.img
对比微码给出的校验值,这个最好还是要做,我们一个老大经常教导我们:警钟长鸣,事故为零
这个的校验码好像是47728,详细的自己再查一下,以网站上的为准

校验没问题,现在就开始升微码

#cd /usr/lpp/diagnostics/bin
#./update_flash –f /tmp/fwupdate/3R070425.img

这个两个命令下去,机器重新启动,要大概半个小时,启动后就是新的微码了。

启动后:
#lsmcode –c
那么
Platform firmware level is 3R070425

OK,又写完一篇,今天就到这里,明天要出差,后天接着写。

2008-1-9 01:33 炸鸡
这样下去,半年就可以超过我了。:L

你怎么能记得这么详细,还加上自己的理解,想不赞你都不行。:lol

2008-1-9 08:40 myciciy
恩 慢慢学习了

2008-1-9 09:02 wui_123
楼主果然记忆力超强 楼主做完事后把过程记下来的好习惯值得大家学习:D

2008-1-9 09:29 haomao1879
:lu3: :lu3:

2008-1-9 09:35 jingsun
看好楼主啊。。。。

2008-1-9 09:52 迷途羔羊
看过不顶都不行,非常喜欢楼主的做事方法 。

2008-1-9 10:15 gyj2008
LS的,看你的网名很眼熟。:o

2008-1-9 10:19 anlen.qi
顶你,哥们,
继续写下去:victory:

2008-1-9 10:35 chen78822
鼓励一下,继续写下去,大家分享!

2008-1-9 14:51 caiwen
恩,共同学习

2008-1-9 22:48 裸奔的孩子
[size=4][color=DarkSlateGray]2007年12月9日       DS4700更换硬盘[/color][/size]

首先谢谢各位的支持了。
今天继续.......
今天客户的一台DS4700一个硬盘挂了,拿到备件后就到现场了。

先打开本本,然后找到那台出问题的DS4700,然后连到控制器A上。
这里我细说一下,DS4700后面左面的是控制器A,右边的是控制器B
每个控制器有两个电口,右边的为1号,左边为2号。IP地址如下:

控制器A--1 左口默认IP地址:  192.168.129 .101
控制器A--1 右口默认IP地址:  192.168.128 .101


控制器B--1 左口默认IP地址:  192.168.128 .102
控制器B--1 右口默认IP地址:  192.168.129 .102

我连了控制器A的右口,然后配置IP地址为192.168.128 .102,掩码为255.255.255.0

先ping 192.168.128 .101 ,PING 的通的话打开Storage Manager Client
可以直接让它自动检测,检测不到的话你输入192.168.128 .101就连上了

然后先点上面的听诊器图标,这里报了两个错误,一个是PowerSupply的,另一个是Disk Failed的
硬盘挂了是今天的主题,但是出了个电源的报错,先处理下
仔细看了一下说冗余电源没有连通什么什么的,仔细检查了下发现冗余电源的开关没打开,将开关按下,冗余电源点亮了,重新看出错,只剩下硬盘的。

这里多说一句,做任何操作最好严格的按照ServiceGuide一步一步来,不要急,尤其是搞硬盘这些,乱搞是会出问题的。
现在从SM里面先看看情况,明显的看到Slot 13上的硬盘已经是Failed的状态了,一个红色的叉,这个时候你千万要看清楚Hotspare盘是不是已经成功接管了,鼠标放到一个全灰底部有十字的盘上看看是不是写了已经是In Use状态,并且接管的是Slot13的盘,当这一切确认后,开始换盘。

先仔细确认坏盘的位置(有黄色警示灯的,这个拔错了就没法说你了)
先把手在机架上随便摸摸,或者带上机架上的防静电手腕
把卡扣拉松,等待70秒,然后把坏盘小心抽出,再等待70秒插入新盘,推紧,然后推上卡扣。

这个过程中不要断开你的SM软件,这个时候你看SM,Slot13上的那个盘上面会出现一个旋风的图案,那是盘开始Building了,等待大概2个小时左右,等这个盘的状态变成了和其他盘状态一样就可以了。这个时候Hotspare盘会恢复为空闲状态。

整个过程就完了。

2008-1-10 09:54 taolin9905310
跟着楼主慢慢学习

2008-1-10 17:33 xxxqing
顶楼主,跟着lz一起学习,进步.

2008-1-10 22:16 orian
[quote]原帖由 [i]炸鸡[/i] 于 2008-1-9 01:33 发表 [url=http://www.loveunix.net/discuz/redirect.php?goto=findpost&pid=753536&ptid=80597][img]http://www.loveunix.net/discuz/images/common/back.gif[/img][/url]
这样下去,半年就可以超过我了。:L

你怎么能记得这么详细,还加上自己的理解,想不赞你都不行。:lol [/quote]

有三个月就可以超过我了,超过鸡鸡至少要半年:victory:

2008-1-10 22:22 zhangwn
[quote]原帖由 [i]wui_123[/i] 于 2008-1-9 09:02 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=753556&ptid=80597][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]
楼主果然记忆力超强 楼主做完事后把过程记下来的好习惯值得大家学习:D [/quote]

使人容易浮想联翩呀:loveliness:

2008-1-10 22:32 五“宅”一生
赶紧来占个位置。:victory:

2008-1-11 09:48 wcp2004
好东西,谢谢!

2008-1-11 09:57 haomao1879
好东西

2008-1-11 10:04 小猪
嘿嘿.:lu4: 写得8错.

2008-1-11 10:06 neoniu
[quote]原帖由 [i]orian[/i] 于 2008-1-10 22:16 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=754311&ptid=80597][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]


有三个月就可以超过我了,超过鸡鸡至少要半年:victory: [/quote]

不带你们这么谦虚的阿,我都看不下去了。
向LZ学习,LZ,快,多发。

2008-1-11 10:10 小猪
[quote]原帖由 [i]neoniu[/i] 于 2008-1-11 10:06 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=754462&ptid=80597][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]


不带你们这么谦虚的阿,我都看不下去了。
向LZ学习,LZ,快,多发。 [/quote]
科技以牛为本.;P

页: [1] 2 3 4 5 6 7 8


Powered by Discuz! Archiver 5.5.0  © 2001-2006 Comsenz Inc.