OSN3500设备GSCC升级到5.21.19.31版本后上报hard_bad
问题描述
OSN3500 SDH传输设备新发货版本有5.21.18.50P01还有5.21.19.31版本,用户要求统一版本,从5.21.18.50P01升级到5.21.19.31,升级完成后,一台OSN3500设备主备主控板都上报hard_bad告警,主备主控频繁倒换、设备主控板为SSN1GSCC01单板
告警信息
截取网元部分告警如下:
17 HARD_BAD CR end 2011-06-04 09:53:26 2011-06-04 09:54:25 0xff 0xff 0xff 0x01 0x00
17 HARD_BAD CR end 2011-06-04 09:54:36 2011-06-04 09:55:45 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:28:50 2011-06-04 10:28:55 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:40:34 2011-06-04 10:40:38 0xff 0xff 0xff 0x01 0x00
18 HARD_BAD CR end 2011-06-04 10:52:00 2011-06-04 10:52:14 0xff 0xff 0xff 0x01 0x00
处理过程
1、核实升级动作,一共加载了7个站点都没有问题,软件包问题排除;工程师严格按照指导书操作,升级过程无错误提示,升级顺利,和升级过程没有关系;
2、两块单板都上报hard_bad告警,同时故障的可能性不大,因上报告警后主备主控板频繁发生倒换,所以单板告警不可能是误报;
3、现场全量采集数据返回分析,核实结果如下(详细分析过程见附件):
SSN1GSCC01主控在V100R009C04SPC200版本(19.31)下底层dwReadV36接口实现错误,读取到了3.3V电压的值,从而概率性上报hard_bad告警。
4、出现此问题可以考虑:
A、版本降级到R8主流版本V100R008C02SPC200或者V100R008C02SPC300,或升级到R10版本。
B、更换为非N1GSCC01单板,如N1GSCC02,N4GSCC等单板;现场更换为N4GSCC单板问题解决
根因
1、主机软件升级过程有问题,没有正确加载软件;
2、主控板硬件故障;
3、主机软件和主控板配合问题;
4、告警误报;
建议与总结
如果有升级需求,建议核实下发布的设备版本策略,因为5.21.18.50P01版本就是主流维护版本,现网运行稳定,而5.21.19.31版本是针对有数据特性特殊需求局点而使用的版本,此问题站点现网实际没有升级必要;
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:查询OSN3500设备SLQ1单板光功显示不正确 2018-12-8
- 下一篇:OSN3500设备配置错PQ1接口板导致无法创建TPS保护组 2018-12-8