OSN3500设备SSN4SL64光板故障导致ECC不通
问题描述
逆时针方向170-178-179-180-181-182网元组成MSP环。其中170为OSN7500,其余设备为OSN3500设备。在178站点通过ECC链路管理显示178到达170网元是通过179网元进行转发。170网元11-T2SL64和178网元8-N2SL64对接。
告警信息
无
处理过程
1)使用网管和命令行CM-GET-BDINFO检查170网元ECC分配情况正常
显示如下: FIBER-PORT-STATE
BID PORT PORT-STATE PORT-RATE LINK-CHAN LOGIC-CHAN-STATE
6 1 port-enable D1-D3 0 ok
6 2 port-enable D1-D3 1 ok
7 1 port-enable D1-D3 2 ok
8 1 port-enable D1-D3 3 ok
11 1 port-enable D1-D3 4 ok
12 1 port-enable D1-D3 5 ok
13 1 port-enable D1-D3 6 ok
使用cm-get-chaninfo:4命令查询对应单板的ECC通道状态,显示收发字节都有且在增加(详细见附件),但DNEID显示的是0X00FFFFFF,SNEID显示的是0x000900b2(178)
2)在178网元使用cm-get-bdinfo命令查询显示为收失败
FIBER-PORT-STATE
BID PORT PORT-STATE PORT-RATE LINK-CHAN LOGIC-CHAN-STATE
8 1 port-enable D1-D3 0 rx_f
11 1 port-enable D1-D3 1 ok
使用cm-get-chaninfo:0命令查询显示此通道只有发字节,没有收字节。但DNEID显示的是0000000000,SNEID显示的是0000000000。
3)在170,178使用命令cm-get-chanerror查询,此两单板ECC通道均无误码。
4)硬复位170站点GSCC,178站点GSCC单板,现象依旧,硬复位170站点SL64单板,178站点SL64单板,现象依旧。
5)更换178站点SL64单板,故障解决。
根因
1)170,178站点ECC设置问题(没有使能,使用字节不一致,ECC)
2)ECC通道数量不够
3)主控问题
4)线路单板问题
5)其他问题如ECC协议栈校验开关不一致等
建议与总结
ECC故障原因比较多,有误码导致,ECC校验状态不一致,端口分配,使能状态,通道字节(D1-D12,D1-D3,D4-D12),主机,线路单板等。定位故障时cm-get-eccroute,cm-get-bdinfo,cm-get-chaninfo,cm-get-chanerror这几条命令是非常有用的,通过对返回参数的分析基本可以定位到故障站点和故障单板。
- 上一篇:Optix OSN2500 SSN1PQM单板不能够保护N2PQ1单板 2018-5-25
- 下一篇:华为光模块1310nm 单模和多模光模块主要有哪些区别 2018-5-25