LoveUnix » AIX -IBM UNIX » HA 没有碰见过的问题!!!
让LU留住您的每

一天 让LU博客留住您的每一天
2008-5-15 22:37 大米粥
HA 没有碰见过的问题!!!

HACMP 5.4   AIX 5300-07

第一次HA 启动没有任何问题,集成商喜欢切来切去,不下13次。。

终于出现了他想要的结果。。。偏偏这个结果还找不到任何问题。

出现的情况是 : A机停止 应用并迁移资源组!然后再启动A机 服务!

在做HA node A 启动的时候谁出现了以下代码!

Cannot refresh local ODM cache for node app.
This node may be inaccessible.



查了以前帖子也有类似回复

[quote]原帖由 [i]老农[/i] 于 2007-10-29 15:09 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=732334&ptid=78021][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]
cldare: Unable to connect to node node_b [/quote]

然后又去考虑 理解是不是 错误与此错误相同!!!!

查到 cldare: Unable to connect to node node_b 的回复是
[quote]原帖由 [i]wxia[/i] 于 2004-9-24 13:31 发表 [url=http://bbs.chinaunix.net/redirect.php?goto=findpost&pid=2753847&ptid=413581][img]http://bbs.chinaunix.net/images/common/back.gif[/img][/url]
是不是rhost没设对啊?
hacmp5的rhost文件在/usr/sbin/cluster/etc/下面,格式和从前的.rhost一样的。 [/quote]

于是找到了以下这些话!

如果 /usr/sbin/cluster/etc/rhosts 文件丢失,或者未包含针对远程发起节点的条目(IP 地址或可解析的 IP 标签),则不允许进入的连接。

如果 HACMPnode、HACMPadapter ODM 类别和 /usr/sbin/cluster/etc/rhosts 文件为空,则 clcomdES 假设集群正在进行配置,并接受传入的连接,然后在初始配置完成后,将对等节点的 IP 标签(地址)添加到 /usr/sbin/cluster/etc/rhosts 文件。

如果请求连接的 IP 地址与上述位置(HACMPadapter、HACMPnode 和 /usr/es/sbin/cluster/etc/rhosts)中的某个标签匹配,则 clcomdES 将反过来连接到请求节点,并要求提供 IP 标签(主机名称);如果返回的 IP 标签(主机名称)与请求 IP 地址匹配,则身份验证成功完成。

[b]实在是找不到所谓的原版![/b]

看到这里,基本大概故障现象老听!

怀疑 rhosts 文件写错!

[color=Red]host1][root]vi /.rhosts
host1
host1_l2_boot1       
host1_l1_boot1       
host1_l2_svc         
host1_l1_svc1       
host1_l1_svc2       
host1_l2_boot2       
host1_l1_boot2       
host2
host2_l2_boot1
host2_l1_boot1       
host2_l2_svc         
host2_l1_svc1         
host2_l1_svc2         
host2_l2_boot2       
host2_l1_boot2       



在 HACMP 5.2 中为了安全起见,不再使用 /.rhosts 文件来控制两台机器之间的命令和数据交换,使用 /usr/es/sbin/cluster/etc/rhosts 文件来代替 /.rhosts 文件的功能。

注意:如果两个节点间的通讯发生了什么问题,可以检查 rhosts 文件,或者编辑 rhosts 文件加入两个节点的网络信息。为方便配置期间检查发现问题,配置期间我们让 /.rhosts 和 HACMP 的 rhosts 一致。

cp /.rhosts /usr/es/sbin/cluster/etc/rhosts
rcp /.rhosts host2:/usr/es/sbin/cluster/etc/rhosts
rcp /.rhosts host2:/ [/color]


这些是我在ibm网站找到的资料!

而我在 rhosts中填写的却是 node A 与 node B 的 boot IP 与 standby IP

[color=Red]192.168.2.100
192.168.3.100
192.168.2.200
192.168.3.200[/color]

以上为我HA中 rhosts 文件内容!!!

那么我的问题来了。。。请问,我的问题是不是就出现在rhosts的内容里面 !!!

[[i] 本帖最后由 大米粥 于 2008-5-15 23:27 编辑 [/i]]

2008-5-15 22:56 老农
LZ,你都不注意版本的么?

2008-5-15 23:07 大米粥
[quote]原帖由 [i]老农[/i] 于 2008-5-15 22:56 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=787904&ptid=84632][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]
LZ,你都不注意版本的么? [/quote]


版本。。 HACMP5.4的版本!!!AIX  5300 -07

在 HACMP 5.2 中为了安全起见,不再使用 /.rhosts 文件来控制两台机器之间的命令和数据交换,使用 /usr/es/sbin/cluster/etc/rhosts 文件来代替 /.rhosts 文件的功能。

早期版本使用/.rhosts   5.2版本里面还是使用/usr/es/sbin/cluster/etc/rhosts 来代替?

我想不到问题的精髓!!!

[[i] 本帖最后由 大米粥 于 2008-5-15 23:16 编辑 [/i]]

2008-5-15 23:09 yurual
为啥不翻番54/52的 doc,guide

2008-5-15 23:20 skybear2008
在同步一次呢?  有错误出现么?

2008-5-15 23:28 大米粥
[quote]原帖由 [i]skybear2008[/i] 于 2008-5-15 23:20 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=787912&ptid=84632][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]
在同步一次呢?  有错误出现么? [/quote]


同步一次后结果正常!但来回切换就又会出现这个问题。。。。

现在就是搞不懂这个问题到底是哪里引起!

2008-5-15 23:36 指尖流沙
两边的/etc/hosts文件呢?

2008-5-15 23:42 大米粥
[quote]原帖由 [i]指尖流沙[/i] 于 2008-5-15 23:36 发表 [url=http://bbs.loveunix.net/redirect.php?goto=findpost&pid=787919&ptid=84632][img]http://bbs.loveunix.net/images/common/back.gif[/img][/url]
两边的/etc/hosts文件呢? [/quote]


两边 /etc/hosts 文件绝对正常,这个保准不会出错!

2008-5-16 02:49 老农
你的基础,根本还没到搞HACMP的时候呢

2008-5-16 08:50 xuandhe
照lz的说法,在切换第13次之前,都没有问题?

2008-5-16 08:57 helpme
集成商干啥去了

2008-5-16 20:36 AlexChen2008
不能连接的节点上的/usr/es/sbin/cluster/etc/rhosts文件还在吗?若缺失,绝对不能连接。

2008-5-17 17:36 benq011
关注学习

2008-5-17 21:06 zhaopingzi
关注学习,知道的讲一下,谢谢.不要打诳

2008-5-21 15:19 koh
我觉得照楼主这种解决问题的方法,永远得不到精髓。 你至少得了解每个组件功能是啥,才能去诊断问题。你之前切来切去切13次了,你还在考虑是不是rhost的问题。如果rhost有问题你开始怎么同步节点和启应用的?这个现象我看是心跳网络都断了,2个节点都在启应用。 至于为啥,你自己研究研究hacmp.out .  在hacmp的配置中,hosts文件比rhosts要远重要的多。 基本上稀奇古怪都可能是hosts文件不同步或配置错误引起的。

2008-5-21 15:44 老农
没基础瞎搞就容易这样了。

2008-5-21 16:19 指尖流沙
不懂HACMP的原理,说不上来!不过你可以查一下/tmp/clstrmgr.debug!

2008-5-21 16:44 youyusi
也来了解了解。学习学习

页: [1]


Powered by Discuz! Archiver 5.5.0  © 2001-2006 Comsenz Inc.