华为带扩展子架的OSN3500设备更换主控板时业务中断
问题描述
某运营商一台带扩展子架的华为OSN3500(版本5.21.18.50)设备上报RTC_FAIL告警,更换主控板进行处理,在更换过程中插上新主控后,发现扩展子架上落地的业务部分中断,修改ID并下发完网管数据到新主控后业务恢复。
告警信息
到此OSN3500业务落地的接入侧网元相应业务上报TU_AIS,中断业务均为到OSN3500扩展子架上落地的业务,OSN3500侧无告警。
单板类型 | 功能块类型 | 位置信息2 | 告警名称 | 告警恢复类型 | 告警确认类型 | 告警描述 |
EOW | OTHER | TEMP_OVER | 自动恢复 | 手工确认 | 工作温度过限 | |
UXCSB | OTHER | TEMP_OVER | 自动恢复 | 手工确认 | 工作温度过限 | |
GSCC | OTHER | RTC_FAIL | 核对恢复 | 手工确认 | 主控RTC(实时时钟)计时失败告警 | |
PD1 | PPI | BIP_EXC | 自动恢复 | 手工确认 | BIP误码过量 | |
R1SLQ1 | RS | R_LOF | 自动恢复 | 手工确认 | 接收线路侧帧丢失 | |
PD1 | PPI | BIP_EXC | 自动恢复 | 手工确认 | BIP误码过量 | |
N1SLQ1 | RS | R_LOF | 自动恢复 | 手工确认 | 接收线路侧帧丢失 | |
PD1 | PPI | BIP_EXC | 自动恢复 | 手工确认 | BIP误码过量 | |
N4EFS0 | VCTRUNK | ALM_GFP_dLFD | 自动恢复 | 手工确认 | GFP失步 | |
N4EFS0 | VC12 | LP_UNEQ_VC12 | 自动恢复 | 手工确认 | VC12级别低阶通道信号未装载 | |
R1SLQ1 | VC4 | AU_AIS | 自动恢复 | 手工确认 | AU告警指示 |
处理过程
1、对客户发回的操作日志及业务中断时的转储告警进行分析,可以确定主控更换上后网管数据下载之前也就已经中断。
2、将数据发给研发分析。
3、分析结果如下:
当OSN3500为单主控更换主控板时,如果新更换的主控板上有扩展子架的配置信息(也就是对XCE有逻辑配置),就会把新主控的关于扩展子架的数据主动下发到网元上去,从而导致到扩展子架上的业务中断。
对于OSN3500 R6版本及以后的设备均有此特性。
更换此类配置的主控板时,要先将新主控插在备用主控槽位后进行主控板的主备数据同步,然后进行主备主控倒换,最后再更换。
附件为业务中断时的告警及操作日志:更换主控网元ID为700,业务中断从Thu Feb 04 22:55:10 2010开始。可以结合操作日志判断业务中断时间点即为更换主控后下发网管数据完成前。
根因
华为OSN3500设备特性
建议与总结
当更换带有扩展子架的OSN3500设备时,如果版本为R6或R6以上并且为单主控配置,要先将新主控插在备用主控槽位后进行主控板的主备数据同步,然后进行主备主控倒换,最后再更换。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:华为OSN3500设备主控升级和降级时请注意GSCC硬件版本 2018-12-11
- 下一篇:华为MPLS OSN3500 APS外部倒换优先级同SDH设备的异同 2018-12-11