OSN3500 GSCC系统板故障引起网元脱管
OSN3500 GSCC单板的功能版本为N4和N6。N4GSCC和N6GSCC支持的分组系统,GSCC单板为智能系统控制板,协同网络管理系统对设备的各单板进行管理,实现各个设备之间的相互通信。单板支持主控、公务、通信和系统电源监控等功能和特性。单板由通信与控制模块、开销处理模块和电源模块组成。单板需要按要求插放在子架的相应槽位上,否则单板无法正常工作。单板提供10M/100M的Ethernet接口,用于与网管通信。Ethernet接口通过AUX板引出。在分组系统应用中,需要配置两个N4GSCC/N6GSCC,相同版本的GSCC采用1+1备份,GSCC单板可以插在子架的slot 17、slot 18。默认slot 18为主板槽位,slot 17为备板槽位。
题描述
OSN3500网关网元异常脱管,业务正常,一会儿自动正常监控,查询网元侧历史告警返回为空,用户需要分析原因。主机版本5.21.18.50P01,主控型号为SSN4GSCC。
告警信息
GNE_CONNECT_FAIL、NE_COMMU_BREAK
处理过程
1、由于该网元是网关网元,所以建议用户ping一下对应IP,用户反馈还未来得及ping测就已经恢复监控;
2、建议用户将该网元主用网关修改为其他网关网元,然后将连接设备的网线接入电脑进行长ping,看是否有丢包或中断情况,长实践测试发现DCN没问题;
3、相邻网元没有异常告警并且业务正常,排除网元掉电问题;
4、由于查询网元上历史告警返回为空,所以怀疑主控板复位,采集errlog复位记录返回研发分析,发现存在平台tVos1s任务复位,如下图红色部分;
5、咨询研发得知,对于SSN4GSCC,主机18.55以前版本存在已知平台问题:8560 diab编译器数组初始化-- tVos1s异常复位;
6、触发主机复位的条件是:无CPU单板比如PIU、AUX等频繁复位引起的小概率事件。
【解决方法】升级至V1R8C02SPC500(5.21.18.55)版本解决。
根因
1、用户DCN问题;
2、设备掉电;
3、主控板复位;
4、主控板故障。
建议与总结
建议发布预警,不然一线工程师很难判断和定位故障,影响故障处理及时率。
本章技术资料和相关SDH设备故障处理流程由深圳市鼎为网络技有限公司提供(www.szdingwei.net),转载请保留。华为SDH光传输设备,SDH传输设备销售电话:13430988088 欢迎电话咨询!
- 上一篇:OSN3500_OSN2500_OSN1500_SDH传输设备功耗 2018-7-4
- 下一篇:OSN3500 SDH传输设备EFS0无法传送BPDU生成树报文 2018-7-4