OSN3500支路板告警处理导致MSP倒换后上报V5_VCAIS
OSN3500支路板V5_VCAIS告警表示低阶通道VC-12中V5字节的第5比特到第7比特全为“1”。该告警会造成单板TU通道业务传输异常。告警V5_VCAIS产生的可能原因如下:业务上游单板存在PLL_FAIL、CHIP_FAIL等硬件故障告警。本支路单板硬件故障。
问题描述
某日客户对网络10个OSN3500组成的STM-64MSP环进行清理光纤操作时,发生MSP倒换,此时一站点部分支路板上报V5_VCAIS和TU-AIS告警。客户检测用户侧业务无任何影响,告警在3分钟内逐渐消失。次日晚,随客户一起做MSP倒换测试,告警依旧,业务正常。
告警信息
V5_VCAIS,TU-AIS
处理过程
根据结论将设备的主控和单板升级至V1R7版本配套。倒换测试后无任何异常告警。
V5_VCAIS根因
检查此OSN3500设备主机版本为:5.21.13.47p01. 此设备带扩展子架,共计各类单板72 。
1.查看资料V5_VCAIS告警表示低阶通道VC-12中V5字节的第5比特到第7比特全为“1”。此告警将影响业务。
2.分析单板黑甲子bb4.log和bb9.log。
3.当单板通过单板方式同时上报给主机的告警条数过大时(超过1024),就会有告警队列溢出的现象,在主机上有告警队列ID溢出的打印,导致部分告警的end消息丢弃掉(由于当时复用段倒换的时候,单板会有瞬间的业务中断,并上报大量告警,但实际的业务只是瞬断,没有影响到业务和倒换测试。另外就是此网元单板非常的多,告警队列溢出的可能性非常大)。4.此告警必须靠主机的1分钟校验事件校验,通过3分钟后将告警结束掉(所以看到上报的告警都在3分钟内结束,就是有主机在3分钟的校验检测后,把其滤掉的)。
5.定位分析,提出单板用多包方式上报告警给主机,单板将打包成64告警为一包上报给主机,而主机的消息队列是1024的长度,可以将主机的处理能力大大提高,通过测试该现象消失,能正常产生也能正常结束。
6.结论:因R1~R6未修改单板软件用多包方式上报告警的版本,而V1R7软件版本已经解决单板多包方式上报。所以需要将单板升级到V1R7版本且主机配套。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:OSN3500光纤传输设备N1EMS2创建VB业务无法挂接端口 2019-9-5
- 下一篇:OSN3500设备N1EFT8以太网业务透传板误报HARD_BAD告警 2019-9-5