OSN3500 N3EAS2单板不响应主机下发的命令
问题描述
现网OSN3500网元使用V100R010C03SPC200版本,网元上有三块N3EAS2单板,在没有对三块单板做任何操作的情况下,某天发现三块单板都无法响应任何命令,所有下发单板或者软件平台的命令都返回超时。
处理过程
1,所有下发单板和软件平台的命令,比如:ethn-cfg-get-vctrunkreal,ethn-cfg-get-portbdpara,cfg-get-bdverinfo以及单板性能都返回超时,所以首先怀疑单板软件有任务挂死导致无法响应命令。
2,由于命令无法响应,所以协调一线上站连接串口,从串口查询未发现有任务挂起,单板底层通信也无丢包和错报,但是DMM ping一直不通,所以怀疑软件平台有问题把主机发过来的消息丢弃了。
3,进一步定位发现由于软件设计有bug,导致拔插网元上其他无CPU的单板(比如接口板、风扇等)时,N3EAS2单板收到主机广播的离线消息误认为主控离线,从而不再响应主控发来的消息,对外表现就是单板不响应命令。
根因
单板软件设计bug,导致拔插网元上其他单板时N3EAS2误认为主控离线,从而不再响应主控发过来的消息,导致单板不响应命令。
解决方案
1,临时解决方案:拔插N3EAS2单板。但如果后续有人再次拔插网元上的其他单板又会导致问题重新出现。
2,彻底解决方案:升级软件到V100R010C03SPC202及其后续版本。
- 上一篇:OSN2500 SSN2EGS2光模块配置错误交换机上报LINK_DOWN告警 2018-5-22
- 下一篇:Optix OSN3500 SSN4GSCC报SYNC_FAIL告警 2018-5-22