Optix OSN3500 SSN1EFT8误报HARD_BAD告警
问题描述
某局OSN3500设备15槽位N1EFT8单板上报HARD_BAD告警,告警参数:0x13 0xff 0xff 0xff 0xff,单板上承载业务一直未受任何影响。主控版本是5.21.13.47P01,N1EFT8单板版本3.16。
告警信息
HARD_BAD
处理过程
1. 更换15槽位N1EFT8单板告警依旧,将更换下来的单板插在16槽位没有上报HARD_BAD告警,之后将15槽位业务割接至16槽,16槽位N1EFT8单板又开始上报HARD_BAD告警,15槽位HARD_BAD告警在删除业务后结束。怀疑是告警误报。
2、咨询研发,得知EFT8单板为了规避9785的断流缺陷,使用了9785缺陷规避方案,该方案的原理大致如下:PHY9785提供了寄存器用于指示PHY是否接收到报文和PHY是否发送报文。因此EFT8软件通过检测PHY是否接收到报文,以及MAC是否接收到报文来判断接收侧是否断流;通过检测PHY是否发送报文,以及MAC是否发送报文来检测发送侧是否断流;检测到端口断流后,软件会复位9785芯片,尝试恢复业务,如果复位8次业务都没有恢复的话,则不再尝试复位,且上报HARD_BAD告警。
3、怀疑是9785缺陷规避方案误检测导致误报HARD_BAD告警。按照附件的采集指导采集数据,研发分析确认是告警误报。升级单板软件至7.54及以后版本可以彻底解决。
2、咨询研发,得知EFT8单板为了规避9785的断流缺陷,使用了9785缺陷规避方案,该方案的原理大致如下:PHY9785提供了寄存器用于指示PHY是否接收到报文和PHY是否发送报文。因此EFT8软件通过检测PHY是否接收到报文,以及MAC是否接收到报文来判断接收侧是否断流;通过检测PHY是否发送报文,以及MAC是否发送报文来检测发送侧是否断流;检测到端口断流后,软件会复位9785芯片,尝试恢复业务,如果复位8次业务都没有恢复的话,则不再尝试复位,且上报HARD_BAD告警。
3、怀疑是9785缺陷规避方案误检测导致误报HARD_BAD告警。按照附件的采集指导采集数据,研发分析确认是告警误报。升级单板软件至7.54及以后版本可以彻底解决。
根因
1、单板硬件故障;
2、版本缺陷导致告警误报。
2、版本缺陷导致告警误报。
解决方案
建议与总结
附件的指导书适用于N1EFT4、N1EFT8和N1EFT8A。
销售OSN3500 SSN1EFT8_产品报价_销售厂家_产品特性_产品描述_华为SDH传输设备销售
供应OSN3500 SSN1EFT8_故障处理_安装调测_技术指标_技术参数_华为SDH传输设备销售
- 上一篇:OSN3500 SSN1SXCSA上报BUS_ERR告警 2018-5-20
- 下一篇:Optix OSN3500 SSN5EFS0不能绑定时隙 2018-5-20