OSN3500 N2EFS4上报COMMUN_FAIL告警
问题描述
多台OSN3500 SSN2EFS4单板上报COMMUN_FAIL告警,涉及多块单板,故障现象一样,版本一致。告警参数为0x03,表示板间以太网通信故障。2小时左右上报一次,每次上报时间10S左右自动恢复。
主控版本:5.21.17.31
N2EFS4单板版本为5.30
AUX单板版本为3.13
告警信息
频繁上报COMMUN_FAIL告警。
处理过程
1、查看单板复位记录,单板有大量复位记录。
2、所单板均为狗复位,从错误记录上来看是申请内存失败。
3、查看发现EFS4单板对接的M500 EFT单板端口均存在ETH_LOS告警。
4、核实为EFS4单板对接的M500 EFT单板端口ETH_LOS告警,不断向EFS单板发送GFP客户信号丢失帧,导致EFS单板GFP管理帧处理任务申请内存后没有处理释放,最终导致单板内存耗尽复位,上报COMMUN_FAIL告警。
5、排查对接单板情况,消除其端口ETH_LOS告警可以规避此问题。根本解决该问题需要升级单板软件到V1R8C01B01c或以后版本。
根因
1、单板复位引起通信失败。
2、主控单板和以太网单板间通讯故障
3、告警误告。
解决方案
建议与总结
对于涉及多块单板相同现象故障的处理,需要找到共同点,不仅是单板本身,和其对接的单板,环境因素等都需要考虑。
- 上一篇:OSN3500 SSN3EGS2配置EPLAN业务接入点延时过大 2018-5-20
- 下一篇:OSN3500 SSN4EGS4 GE电接口配置保护失败 2018-5-20