华为OSN3500设备总线误码导致交叉倒换后业务中断
问题描述
客户做华为OSN3500设备交叉主备倒换测试时,在134站点倒换交叉板到9号ssn1uxcsa为主用后,本站8-N3SL16-1单板1/2/3/4通道上报HP-RDI,同时下游132站点7-N3SL16-1单板上报AU-AIS,业务中断。设备版本为5.21.17.12。客户重新倒换回10号业务恢复。
告警信息
Minor HP_RDI 134 Kaka 8-N3SL16-1(SDH-1)-VC4:4 28-05-2012 04:03:23 28-05-2012 06:02:51
Major AU_AIS 132 Babadurmaz 7-N3SL16-1(SDH-1)-VC4:1 28-05-2012 04:03:22 28-05-2012 04:05:11
Major AU_AIS 132 Babadurmaz 7-N3SL16-1(SDH-1)-VC4:2 28-05-2012 04:03:22 28-05-2012 04:05:14
Major AU_AIS 132 Babadurmaz 7-N3SL16-1(SDH-1)-VC4:3 28-05-2012 04:03:22 28-05-2012 04:05:14
Major AU_AIS 132 Babadurmaz 7-N3SL16-1(SDH-1)-VC4:4 28-05-2012 04:03:22 28-05-2012 06:02:51
处理过程
1、更换8号线路单板,同时检测备板是否有倒针等异常情况。等单板开工后,下面下面的optp命令,是否为正确。如果正确,再进行交叉主备倒换测试。
:optp:8,0,9b,1,30,08,c6,c6,c6,3c,3c,3c
:optp:8,0,9b,1,1a,61,9,10,14
:optp:8,0,9b,1,30,08,e7,e7,e7,a5,a5,a5
正确情况如下:
:optp:8,0,9b,1,1a,61,9,10,34
Optp cmd : 1a61
00 00
2、检测9号单板备板是否有倒针等异常情况。再更换一块交叉试试。
3、如果1和2都不能排除故障,请更换子架。
工程师最后通过更换N3SL16A单板排除了故障。
根因
由于线路单板为N3SL16A单板,单根总线数率为622M,1/2/3/4通道正好是第一根总线,所以怀疑134网元上,9号槽位交叉板到8号SL16单板的第一根总线故障,或者单板芯片故障导致与9号单板总线连接故障。
1.运行下面的optp命令,读取8号线路单板检测系统侧的告警
:alm-set-monevent:8,TEST_STATUS,0,0,0,disable;
:optp:8,0,9b,1,30,08,c6,c6,c6,3c,3c,3c //进入测试态
:optp:8,0,9b,1,1a,61,9,10,14 //读取8槽位开销芯片第一根系统侧总线告警
:optp:8,0,9b,1,30,08,e7,e7,e7,a5,a5,a5//退出测试态
: alm-set-monevent:8,TEST_STATUS,0,0,0,enable;
2.运行结果如下:
#9-134:szhw [134 Kaka ][][2012-06-05 17:17:22+05:00]>
:optp:8,0,9b,1,1a,61,9,10,14
Optp cmd : 1a61
00 60
Total records :1
发现有告警存在,告警为LOF和OOF。而且第一根总线就是连接的9号交叉单板。
建议与总结
线路单板检测交叉板发过来的总线时只有收到LOS或者LOC才会上报T_LOSEX或者TR_LOC。
如果线路单板收系统总线上有误码时,将不会上报告警。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:OSN3500传输设备ETH端口设置问题导致设备无法登陆 2018-12-5
- 下一篇:华为OSN3500设备EFS4和EFT4的流控帧差异说明 2018-12-5