华为SDHOSN1500设备SSN2EGS2单板报commu_fail告警
首先我为大家描述一下华为SDHOSN1500设备SSN2EGS2单板的特性,单板在OSN系列设备上使用时的特性如下,EGS2属于SDH以太网业务处理板单,板支持1000BASE-SX/LX/ZX/VX以太网光接口,支持自协商功能,满足IEEE 802.3z标准。采用可插拔的SFP光接口,多模光纤传输距离最远可达550m,单模光纤达10km(也可根据实际需要选用40km和80km的光模块)。还支持1000BASE-T以太网电接口,支持自协商功能,可自协商为10M、100M或1000M速率。采用可插拔的SFP电接口,传输距离最远可达100m。支持自协商、1000M全双工、100M全双工、10M全双工(仅N3EGS2支持GE电口)。支持自协商、1000M全双工。支持共享VCTRUNK的EVPL业务。支持共享PORT的EVPL业务。大支持2K个黑名单和2K个静态MAC地址,共享2K个。N3EGS2单板的黑名单只支持目的MAC地址校验,不支持源MAC地址校验。支持的VB数目最大为2个,每个VB逻辑端口最大为30个。下面为大家举例说一个在Optix OSN 1500设备上使用以太网业务处理板时遇到的得不案例。
问题描述
SSN2EGS2单板在OSN1500网元上正常运行两个多月后,出现反复上报COMMU_FAIL、LP_SLM_VC12、ETH_LOS告警并且业务中断的问题。在现网进行了软/硬复位单板、拔插单板操作,均无法解决问题。
告警信息
COMMU_FAIL、LP_SLM_VC12、ETH_LOS。
处理过程
1、更换单板为SSN1EGS4等数据单板,SSN1EGS4上软件做了防协议报文冲击的保护机制,所以更换单板后问题得到解决。
2、SSN2EGS2单板软件升级到5.51版本以上。
故障原因1、 分析单板的黑匣子,发现debugbuf.log中记录了大量单板软复位的记录,可见的确是不断的软复位造成了单板反复上报COMMU_FAIL告警,这个告警表示主控与数据板的以太通讯通道发生了中断。由于SSN2EGS2这个单板比较特殊,软复位和硬复位的效果一样,都会中断业务。所以,现网EGS2单板发生反复复位故障时,业务是会反复中断的。而反复上报的LP_SLM_VC12、ETH_LOS告警,也是单板反复软复位所导致。
2、从debugbuf.log黑匣子记录来看,是单板收到了大量协议报文,导致单板CPU占用率过高,从而发生复位。SSN2EGS2单板所采用的5.50版本软件没有做防协议报文冲击的保护机制,当网络上可能因广播风暴产生大量协议报文时,CPU会无法承载负荷而复位,从黑匣子记录也可看到软狗复位时处理协议报文的进程占到了高达47.63%的CPU资源。所以重新拔插单板后,协议报文冲击未解除,EGS2单板依旧会发生复位问题。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司提供(www.szdingwei.net),转载请保留!华为SDH光传输设备,SDH传输设备销售
- 上一篇:OSN1500设备SSN2EFT8单板与中兴SED以太网板对接不通 2018-7-11
- 下一篇:OSN3500设备支路板配置PQ1 2M业务后不能切换时隙模式 2018-7-11