Optix OSN7500备用SST1PSXCSA板上报HSC_UNAVAIL告警
问题描述
OSN7500设备9槽位备用交叉单板上报HSC_UNAVAIL告警不消失,更换备用交叉单板告警还是上报。主控版本为5.21.18.50P01;告警参数为0x02,0x01,0x09。
告警如下:
1145837 9 HSC_UNAVAIL MN end 2014-11-23 15:26:16 2014-11-23 16:08:27 0x02 0x01 0x09 0xff 0xff
告警信息
HSC_UNAVAIL
处理过程
1、出现HSC_UNAVAIL告警,首先从告警参数检查,告警参数0x02 0x01 0x09 0xff 0xff ;
对参数分析为,业务单板检测到9槽位单板故障。
参数1为0x02,对应二进制为0010; bit[1] = 1表示业务板检测到本板坏。
参数2为0x01; 0x01表示备用板。
参数3为0x09 ; 0x09 表示不可用单板的槽位号为9槽位。
2、检查9槽位单板软件配套情况,软件版本配套,排除软件版本不配套情况引起。
3、HSC_UNAVAIL告警参数1中bit[1] = 1表示业务板检测到本板坏,告警上报原理为业务单板检查到接收交叉单板发送来的信号异常,发送状态坏信息给对应交叉单板,交叉单板上报HSC_UNAVAIL告警。
检查其他业务单板没有HARD_BAD等单板异常的告警出现,无法判断哪块业务单板异常。考虑到业务单板检测到接收业务信号异常并不一定能检测到本单板的芯片异常,进一步使用数据采集工具采集数据分析。
检查9槽位交叉单板对应黑匣子日志,交叉单板总线检测异常日志记录在交叉单板的黑匣子BB9日志上,日志记录如下:
91d0ac3f32d242be8736ace5c730fdd4
从日志上可以看到9槽位交叉单板检测到18槽位总线故障。
4、现场通过更换18槽位EFS0单板,HSC_UNAVAIL告警消失。
根因
18槽位EFS0单板硬件故障,导致备用交叉单板9槽位UXCS单板上报HSC_UNAVAIL告警。
解决方案
更换18槽位EFS0单板解决。
建议与总结
当交叉单板检测到业务单板总线异常,交叉单板会倒换,且检测到异常的备用交叉会上报HSC_UNAVAIL告警;可以通过交叉单板的BB9日志来分析排查引起此告警的业务单板。
- 上一篇:OSN7500 SSN1DCU位置接错导致SSN1BPA报IN_PWR_LOW 2018-5-22
- 下一篇:Optix OSN7500 SSN1EMS4设置光口工作模式失败 2018-5-22