SSN4GSCC主控板ECC丢包导致主机业务无法查询
问题描述
1、组网方式为161-162-163-164-165-166-161通过STM-64光板组成的MSP环,161和162为双主控的OSN7500设备,主机软件为5.21.13.43版本。163,164,165,166为单配主控的OSN3500设备,版本为5.21.12.43版本。161为网关网元。
2、在T2000网管上对163 ,164,165,166网元进行业务查询时,无返回值。在经过大约5分钟时间提示服务器超时,用命令行:cfg-get-xc:0,0查询返回数值不完全,没有命令执行完提示用命令行cfg-get-phybd命令可以正常返回。
2、在T2000网管上对163 ,164,165,166网元进行业务查询时,无返回值。在经过大约5分钟时间提示服务器超时,用命令行:cfg-get-xc:0,0查询返回数值不完全,没有命令执行完提示用命令行cfg-get-phybd命令可以正常返回。
告警信息
无
处理过程
1、在161网元上分别强制关闭两端DCC,故障现象一样;
2、主备倒换161的主控板,故障现象一样;
3、现场在166号网元上用cfg-get-xc:0,0命令可以返回正常数值,在T2000网管上也可以正常查询,但是无法通过ECC查询163、164和165网元数值;
4、采集数据给研发分析确认,平台ECC处理模块在处理一个全局的计数器时有BUG,网元A长时间运行后该计数器的值会逐渐累加,从而造成网元A缓存,报文的个数越来越少,最终出现频繁ECC丢包,导致查询大量数据时无法完全返回数值,查询少量数据就可以正常返回;
5、临时规避措施为软复位主控板;
6、彻底解决需要升级主机到V1R3C02B028SP01(5.21.13.45)或以上版本。
2、主备倒换161的主控板,故障现象一样;
3、现场在166号网元上用cfg-get-xc:0,0命令可以返回正常数值,在T2000网管上也可以正常查询,但是无法通过ECC查询163、164和165网元数值;
4、采集数据给研发分析确认,平台ECC处理模块在处理一个全局的计数器时有BUG,网元A长时间运行后该计数器的值会逐渐累加,从而造成网元A缓存,报文的个数越来越少,最终出现频繁ECC丢包,导致查询大量数据时无法完全返回数值,查询少量数据就可以正常返回;
5、临时规避措施为软复位主控板;
6、彻底解决需要升级主机到V1R3C02B028SP01(5.21.13.45)或以上版本。
根因
1、DCC故障;
2、单板故障;
3、版本问题。
2、单板故障;
3、版本问题。
建议与总结
此故障的原因与“关于NG SDH系列产品长期运行后因ECC丢包导致下游网元脱管问题的预警公告 -20060531-A”一致的,只不过描述的现象不一致,我们通过预警来举一反三来处理故障。
END
销售OSN3500 SSN4GSCC_产品报价_销售厂家_产品特性_产品描述_华为SDH传输设备销售
供应OSN3500 SSN4GSCC_故障处理_安装调测_技术指标_技术参数_华为SDH传输设备销售
- 上一篇:NGSDH设备板级热补丁升级后网管无法查询热补丁版本号 2018-6-2
- 下一篇:OSN1500/OSN2500/OSN3500版本不配套导致业务下载失败 2018-6-2