OSN3500 SSN5EFS单板反复上报communfail告警
问题描述
OSN3500站点SSN2EFS4单板反复上报COMMUN_FAIL告警,业务正常,主机版本:5.21.17.31,EFS4版本:5.30。EFS4单板配置的一级汇聚业务,外部端口未使用。
告警信息
commun_fail
处理过程
1、将上报ETH_LOS告警的EFT对应端口去使能,ETH_LOS告警消失后观察,EFS单板不再复位,故障消除。
2、升级单板软件到V1R8C01B01c或后续版本也能够解决此问题。
根因
1、采集单板黑匣子bb5.log,发现有大量申请内存失败记录,ERROR CODE: 70001表示模块ID为0x7E(126)的模块频繁申请0x400(即1K)大小内存的时候,由于内存耗尽申请失败,导致单板软复位。
2、经研发分析导致内存没有释放的原因,确认是N2EFS4不能处理未知的GFP管理帧导致。
3、最终定位为对接M500设备是未知GFP管理帧的来源。EFS单板对接的M500 EFT单板端口存在ETH_LOS告警,不断向EFS单板发送GFP客户信号丢失帧,导致EFS单板GFP管理帧处理任务申请内存后没有处理释放,最终导致单板内存耗尽复位,上报COMMUN_FAIL告警
建议与总结
无
- 上一篇:OSN3500 SSN2PQ3单板TPS保护问题 2018-5-26
- 下一篇:OSN3500 N1GSCC-B2或者N3GSCC-B2主控降级时请注意事项 2018-5-26