OSN3500 SSN1SXCSA上报BUS_ERR告警
问题描述
某局OSN3500设备备用交叉板(10-EXCSA)上报大量BUS_ERR告警,68分钟后自动结束,业务未受影响。
级别 告警名称 监视对象 产生时间 结束时间 告警参数(16进制)
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0f 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0e 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0d 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x05 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x04 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x03 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x02 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x01 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x04 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x03 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x0b 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x04 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x03 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x01 0x06 0x02 0xff
级别 告警名称 监视对象 产生时间 结束时间 告警参数(16进制)
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0f 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0e 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0d 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x06 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x05 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x04 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x03 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x02 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x01 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x04 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x03 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:59 2008-09-10 22:41:45 0x0b 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x0b 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x04 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x03 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x08 0x01 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x02 0x06 0x02 0xff
主要 BUS_ERR CX-ITMC(CX-1)-10-EXCSA-OTHER 2008-09-10 21:33:58 2008-09-10 22:41:45 0x07 0x01 0x06 0x02 0xff
告警信息
BUS_ERR
处理过程
1、该案例中的BUS_ERR告警,是软件屏蔽备用时钟板时钟频繁抖动时上报BUS_ERR的问题,存在概率性屏蔽不成功。
2、NGSDH V1R6C02B012SP04版本已经解决。R7、R8后续提供补丁版本解决。
2、NGSDH V1R6C02B012SP04版本已经解决。R7、R8后续提供补丁版本解决。
根因
1、从告警参数看:0x0f 0x01 0x06 0x02 0xff // 表示主备交叉板握手检测到总线有OOF、B1误码告警,而且所有业务单板都上报。
2、但是所有业务板的总线都出故障的可能性不大,而且两块交叉板同时故障的可能性也不大。因此还是以前两块交叉板之间时钟同步的问题:由于主备交叉板时钟相位同步的设计问题,会导致备板时钟频繁抖动(主备板间时钟异步),进而使备板检测到业务单板过来的外部总线有FIFO溢出、B1误码、OOF、OOA告警,因此上报BUS_ERR告警。
3、为了解决这个问题,软件做了规避:当备板时钟抖动(主备间时钟异步)时,软件会做个时钟异步标志,根据这个标志,软件就不会上报总线上的FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警,而只上报由总线上LOS告警导致的BUS_ERR告警。
4、然而,由于软件的这个规避方案存在缺陷,会概率性导致先检测内部总线(高阶交叉芯片至低阶交叉芯片之间的总线)后检测外部总线(高阶交叉芯片至业务单板之间的总线),这时软件会将异步标志清除,这样软件因为没有这个标志,就会将异步时外部总线上FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警上报。
5、总之,备板时钟抖动时,与业务板之间的时钟不同步,是实际存在的,这样业务板送给备板的总线上也实际存在FIFO溢出、B1误码、OOF、OOA告警,但是不会影响主板的总线,因此软件上屏蔽因FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警。但是由于软件屏蔽缺陷,导致备板时钟异步时,还是将FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警报出来了。该问题在OSN3500、OSN7500的R6/R7/R8版本都存在。
2、但是所有业务板的总线都出故障的可能性不大,而且两块交叉板同时故障的可能性也不大。因此还是以前两块交叉板之间时钟同步的问题:由于主备交叉板时钟相位同步的设计问题,会导致备板时钟频繁抖动(主备板间时钟异步),进而使备板检测到业务单板过来的外部总线有FIFO溢出、B1误码、OOF、OOA告警,因此上报BUS_ERR告警。
3、为了解决这个问题,软件做了规避:当备板时钟抖动(主备间时钟异步)时,软件会做个时钟异步标志,根据这个标志,软件就不会上报总线上的FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警,而只上报由总线上LOS告警导致的BUS_ERR告警。
4、然而,由于软件的这个规避方案存在缺陷,会概率性导致先检测内部总线(高阶交叉芯片至低阶交叉芯片之间的总线)后检测外部总线(高阶交叉芯片至业务单板之间的总线),这时软件会将异步标志清除,这样软件因为没有这个标志,就会将异步时外部总线上FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警上报。
5、总之,备板时钟抖动时,与业务板之间的时钟不同步,是实际存在的,这样业务板送给备板的总线上也实际存在FIFO溢出、B1误码、OOF、OOA告警,但是不会影响主板的总线,因此软件上屏蔽因FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警。但是由于软件屏蔽缺陷,导致备板时钟异步时,还是将FIFO溢出、B1误码、OOF、OOA告警导致的BUS_ERR告警报出来了。该问题在OSN3500、OSN7500的R6/R7/R8版本都存在。
解决方案
建议与总结
销售OSN3500 SSN1SXCSA_产品报价_销售厂家_产品特性_产品描述_华为SDH传输设备销售
供应OSN3500 SSN1SXCSA_故障处理_安装调测_技术指标_技术参数_华为SDH传输设备销售
- 上一篇:OSN3500 SSN2EFT8A Ping大包不通 2018-5-20
- 下一篇:Optix OSN3500 SSN1EFT8误报HARD_BAD告警 2018-5-20