华为OSN3500传输设备判断HARD_BAD告警参数
- Optix OSN3500若HARD_BAD告警是在主控板上报,则参考检查是否主控板上报HARD_BAD告警。
-
若HARD_BAD告警是在交叉、业务单板上报,则参考检查是否交叉板或者业务板上报HARD_BAD告警。
表1 HARD_BAD告警参数表
参数名称
参数含义
参数1
对于混合线路单板:
- 当参数1为0x34表示通过心跳检测方法检测到故障。
- 当参数1为0x13,且参数2为0x02时,需根据参数3的取值不同代表不同含义,详情请参照参数3。
对于交叉时钟单板,代表导致硬件故障的原因类型。
- bit[0]=1表示硬件自动检测到问题而置坏。
- bit[1]=1表示软件巡检发现问题而置坏。
对于主控单板:
- 当参数1≠0xFF,则参数1代表2K/8K线故障的单板板位号。
- 当参数1=0xFF,无意义。
对于TDM域ATM单板、交换数据单板、RPR单板参数1的值固定为0x01。
对于SAN/Video(MST4)单板,参数1代表硬件失效类型。
- bit[0]=1表示有晶振失效。
对于Video(VST4)单板,参数1固定为0x01,无意义。
对于分组处理单板、分组接口单板、双域桥接单板、透传数据单板、OBU1单板,代表的故障原因如下:
- 0x01表示电源模块工作异常。
- 0x02表示单板未可靠安装。(单板与母板未可靠接触,如单板未插紧。)
- 0x03表示38M系统时钟1异常。
- 0x04表示38M系统时钟2异常。
- 0x05表示2M时钟源异常。
- 0x06表示数字锁相环路异常。
- 0x07表示38M业务时钟丢失。
- 0x08表示总线异常。
- 0x09表示TPS保护板异常。
- 0x0A表示时钟主晶振停振。
- 0x0B表示主晶振频偏过大。
- 0x0C表示备用晶振停振。
- 0x0D表示处理器(CPU/DSP/协处理器)故障。
- 0x0E表示存储器件故障。
- 0x0F表示可编程逻辑器件故障。
- 0x10表示SDH器件故障。
- 0x11表示数据通信器件故障。
- 0x12表示时钟类器件故障。
- 0x13表示接口器件故障。
- 0x14表示电源类器件故障。
- 0x15表示其他故障。
- 0x16表示模拟锁相环路异常。
- 0x17表示32M时钟失效。
- 0x18表示66M时钟失效。
- 0x19表示25M时钟失效。
- 0x1A表示交叉芯片环路故障。
- 0x1B表示单板8K在位线为低电平。
对于光放大板BPA/BA2,无告警参数。
参数2
对于混合线路单板:
- 当参数1=0x34时,参数2表示心跳报文所在通道的编号。
- 当参数1=0x13,且参数2=0x02时,需根据参数3的取值不同代表不同含义,详情请参照参数3。
对于交叉时钟单板,代表硬件检测类的具体损坏原因。
对于主控单板:- 当参数1≠0xFF,则参数2~参数5=0xFF,无意义。
- 当参数1=0xFF,则参数2~参数3=0xFF,无意义。参数4和参数5代表不同的含义,详情请分别参照参数4和参数5。
对于TDM域ATM单板,参数2和参数3表示单板故障类型。参数2为固定值0x01表示单板时钟故障。
对于Video(VST4)单板,参数2的值固定为0x01,无意义。
对于分组处理单板、分组接口单板、双域桥接单板、透传数据单板、OBU1单板,根据参数1的取值不同,其对应含义不同。
当参数1=0x08,参数2的含义如下:
- 0x01表示A总线异常。
- 0x02表示B总线异常。
当参数1不为0x08,参数2的值固定为0xFF。
对于10G交换数据板,参数2和参数3代表故障原因:
- 0x04表示FPGA芯片故障。
- 0x06表示锁相环失锁。
- 0x07表示单板使用的某块芯片读写故障。
- 0x0E表示存储器故障。
- 0x0F表示逻辑器件故障。
- 0x12表示时钟失效。
- 0x13表示接口类器件故障。
- 0x14表示电压异常。
- 0x05,0x08,0x15~0x19分别表示单板使用的不同的芯片故障。
对于其他交换数据单板、RPR单板,参数2和参数3代表故障原因:
- 0x01表示电源模块工作异常。
- 0x02表示单板未可靠安装。(单板与母板未可靠接触,如单板未插紧。)
- 0x03表示38M系统时钟1异常。
- 0x04表示38M系统时钟2异常。
- 0x05表示2M时钟源异常。
- 0x06表示数字锁相环路异常。
- 0x07表示38M业务时钟丢失。
- 0x08表示总线异常。
- 0x09表示TPS保护板异常。
- 0x0A表示时钟主晶振停振。
- 0x0B表示主晶振频偏过大。
- 0x0C表示备用晶振停振。
- 0x0D表示处理器(CPU/DSP/协处理器)故障。
- 0x0E表示存储器件故障。
- 0x0F表示可编程逻辑器件故障。
- 0x10表示SDH器件故障。
- 0x11表示数据通信器件故障。
- 0x12表示时钟类器件故障。
- 0x13表示接口器件故障。
- 0x14表示电源类器件故障。
- 0x15表示其他故障。
- 0x16表示模拟锁相环路异常。
- 0x17表示32M时钟失效。
- 0x18表示66M时钟失效。
- 0x19表示25M时钟失效。
- 0x1A表示交叉芯片环路故障。
- 0x1B表示单板8K在位线为低电平。
参数3
对于混合线路单板:
当参数1=0x34时,参数3表示更详细的心跳报文所在通道的信息。如果没有更详细的信息,参数3固定为0xFF。
当参数1=0x13,参数2=0x02时,参数3的取值如下:
- 0x01表示板间通信通道1故障。
- 0x02表示板间通信的FE速率通道(属于通道2)故障。
- 0x03表示板间通信的GE速率通道(属于通道2)故障。
对于交叉时钟单板,代表软件检测类的具体损坏原因。
对于SAN/Video(MST4)单板,代表晶振失效类型。
- 0x01表示212M晶振失效。
- 0x02表示125M晶振失效。
- 0x04表示100M晶振失效。
- 0x08表示135M晶振失效。
参数4
对于交叉时钟单板,参数4含义如下:
- bit[0]=1表示刻痕寄存器读写失败。
- bit[1]=1表示QDR(Quad Data Rate四倍数据速率)上电自检失败。
- bit[2]=1表示APS(Automatic Protection Switching自动保护倒换)逻辑查表返回失败。
- bit[3]=1表示APS逻辑加载状态检测失败。
- bit[5]=1表示控制逻辑通过硬件连接线送达APS逻辑的交叉板主备状态,和控制逻辑实际检测到的状态不一致。
- bit[6]=1表示APS逻辑锁相环失锁。
对于主控单板,如果参数1=0xFF,则参数4代表不同含义。
对于GSCC单板,参数4含义如下:- bit[0]=1表示软件检测到硬件置坏。
- bit[3]=1表示内部芯片置坏。
- bit[4]=1表示20M晶振故障。
- bit[5]=1表示25M晶振故障。
- bit[6]=1表示第一路38M时钟故障。
- bit[7]=1表示第二路38M时钟故障。
对于SCA单板,参数4含义如下:- bit[0]=1表示软件检测到硬件置坏。
- bit[2]=1表示可编程逻辑器件故障。
- bit[3]=1表示32M时钟失效。
- bit[4]=1表示33M晶振故障。
- bit[5]=1表示25M晶振故障。
- bit[6]=1表示第一路38M时钟故障。
- bit[7]=1表示第二路38M时钟故障。
对于Video(VST4)单板,代表故障类型。
- bit[0]=1表示66M PCI时钟故障。
- bit[1]=1表示100M PCIE时钟故障。
- bit[2]=1表示155M时钟故障。
- bit[3]=1表示66M CPU时钟故障。
比特位为1时表示存在该告警,为0时表示不存在该告警。可以多个比特位同时生效。
参数5
对于主控单板,如果参数1=0xFF,参数5代表不同含义。
对于GSCC单板,参数5含义如下:- bit[0]=1表示本板3.3V电源模块故障。
- bit[1]=1表示主控和网管间的以太网端口(ETH)故障。
- bit[2]=1表示主控和其他单板的板间通信以太网端口故障。
- bit[3]=1表示主备主控间内部网口故障。
- bit[4]=1表示1.8432M晶振故障。
对于SCA单板,参数5含义如下:- bit[0]=1表示本板3.3V电源模块故障。
- bit[1]=1表示主控和网管间的以太网端口(ETH)故障。
- bit[2]=1表示主控和其他单板的板间通信以太网端口故障。
- bit[3]=1表示主备主控间内部网口故障。
- bit[4]=1表示125M时钟故障。
比特位为1时表示存在该告警,为0时表示不存在该告警。可以多个比特位同时生效。
备注
例如:参数为0x04,转换成二进制为100,则分别表示bit[2]=1,bit[1]=0,bit[0]=0。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:华为OSN3500检查是否主控板GSCC上报HARD_BAD告警 2019-4-1
- 下一篇:判断华为OSN3500上报COMMUN_FAIL告警参数 2019-4-1