OSN8800主备交叉板上报BUS_ERR告警处理方法
问题描述
OSN8800设备主备交叉单板同时上报BUS_ERR告警,参数为00 02 44
处理过程
2块交叉板同时上报BUS_ERR告警,告警参数相同,有可能是交叉板检测到其他业务板通信问题,导致2块交叉板同时上报告警。
参数为00 02 44,根据规则 para[1]=0x00,para[2]=0x0244,参数2转换成10进制就是580
需要查询总线580到底是在哪块业务单板上?使用Navigator登陆设备,输入如下命令:
clear
:ver
:cfg-get-board
:cfg-get-phybd
:sftm-get-testver:9
:alm-get-curdata-ext:9,0,0
:optp:9,1,83,1,16,66,0,0,1,0,0,ff,ff;
:optp:9,1,83,1,16,66,0,9,1,ff,ff,ff,ff;
:mon-get-dump:9,"ISXCModule.CSXCModule","00009"
得到相关信息
可以知道:580号总线在3槽位单板上
根因
BUSERR出现的原因无外乎以下两种:
1.软件的误报:相关的总线开关状态都设置为打开的,并且当前上报告警的总线对应的芯片寄存器上也是没有告警存在的,但软件上报有告警存在;这种问题直接看看软件为何误报即可;
2.硬件故障:相关的总线开关状态都设置为打开的,但当前上报告警的总线对应的芯片寄存器上有告警存在,芯片确实检测到有故障存在,则先判断以下几种情况是否存在:
交叉板与业务板是否都插紧,槽位是否有倒针,温度是否异常;若上面情况都没有,则再判断单板上影响总线状态的各器件是否都处于正常工作状态,原因总是可以找到的。
以一个最简单的应用场景举例:
交叉板上报的BUSERR是指:业务板à交叉板的总线A的状态;
业务板上报的BUSERR是指:交叉板à业务板的总线B的状态;
因产品现在的BUSERR告警的扩展参数只有三个参数,交叉板上三个扩展参数的含义如下:
para[0]:总线的类型定义,各取值含义如下:
0, 业务板与交叉板连接的高阶总线
1, 低阶的高阶入口(8602入口部分)
2, 低阶总线入口(8601入口部分)
3, 低阶的高阶出口(第5片585的入口部分)
4, 低阶的高阶出口(第5片585与前四片585固定互连部分)
5, 低阶的互连总线(两片8601之间互连的总线)
para[1]:
para[2]:
para[1]与para[2]两个参数组合为一个WORD,para[1]表示高8位,para[2]表示低8位,WORD的值表示的是总线的逻辑编号,当para[0]=0时,该值表示的是高阶的全局总线编号,当para[0] != 0时,该值表示的是低阶的逻辑总线编号
解决方案
更换3槽位ND2单板后,故障消失
建议与总结
熟悉判断告警机理,有效快速定位故障原因
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:OSN8800和6800之间配置跨网元客户侧1+1保护失败 2019-11-30
- 下一篇:OSN8800设备由于主控板FLASH故障导致加载热补丁失败 2019-11-30