您的位置:首页 > 理论基础 > 计算机网络

IBM小型机日常维护之网络故障

2013-06-14 16:35 316 查看
由于我们应用对网络依赖很大,所以当网络出现全阻或瞬断都将对系统产生重大影响,网络故障一般可分为硬件故障(如IBM小型机网卡故障和交换机、路由器故障)和软件故障(网络中有IP包攻击或网络拥塞)两种情况。

硬件故障:
1.小型机网卡
对于网卡故障,由于商用系统中都是采用IBM的HA双机系统,而且每台机器都配置有至少两块网卡,所以当单块网卡或网线出现问题时,HA软件都将采取措施实现Service
IP切换。
网卡故障定位方法:使用errpt –dH 可查看到网卡服务中断的错误,再使用diag进行网卡诊断
网卡故障排查方法:如果诊断出网卡有问题,则关闭系统后进行更换。(如果是主机,则先手工切换为备机后再操作)
2.交换机
我们的网络一般都采取双网双平面的结构,所以当一个网络平面的交换机出现问题时,也不会中断网络服务,
但值得重视的是:主、备交换机之间的直连线要保持畅通,否则一单发生IBM服务器主机或SIU主机的网卡切换,将导致IBM服务器主机和SIU主机断链,从而导致业务全阻。
还有一种情况,有些地方为了网络安全,对连到switch上的不同设备划分了不同的VLAN,同时又将主、备switch之间改成通过两个口连接,并划分在一个channel
group里,当时碰到的一种情况是:
1)当时IBM服务器的主网卡从缺省VLAN0到VLAN6实现迁移时,网络将出现15秒~30秒的瞬断
2)当时主、备交换机之间的channel group工作不正常,链路不通。
当1)发生时,IBM双机发生主、备网卡倒换,但由于2)的问题,导致IBM主机无法与SIU建链。
问题排查及建议:
建议开局时一定要做双网双平面中一个平面的swith发生掉电的故障测试
建议一定要做主、备交换机之间的设备之间的网络互访测试,确保畅通
尽量不要在白天在switch上进行配置修改,如果需要修改,也要在晚上进行,并有严格的方案

软件故障:
1.网络拥塞
由于系统在封闭网络中运行,所以发生网络拥塞的可能性比较小,但如果网络拓扑比较复杂的话,也可能发生这种情况,在主机上的表现为ping主机丢包严重,主机到SIU之间链路时通时断,数据包丢失,设备功能异常。
问题排查及建议:
尽量使NT/2000的机器从网络上隔离出去
如果情况仍未改善,建议启动SIU应急流程
在恢复呼叫的前提下,使用网络工具抓包,找出攻击源、逐步将设备恢复到网络。

2.切换失败

现场碰到过一种情况,当发生主、备机切换时老是切换不成功,检查发现是备机的主网卡绑定浮动IP老是失败,再进一步排查,发现失败的原因是备机主网卡绑定MAX地址失败,由于IBM双机配置时需要将Service
IP配置为一个固定的MAC地址,规则是取主机主网卡的MAC地址,将最后两位改为固定的两个数字(要求与原主网卡地址不同,如定制为89)。但这样的规则在现场不成功
问题排除:最后修改了HA 拓扑图中以太网配置中Service Adapter配置,去掉MAC地址的配置(置为空),让后同步双机,再进行倒换,一切OK

由于网络故障出现会导致远程登录失效,所以无法进行系统维护。所以建议任何一套IBM小型机都要配置一个维护台。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: