OSN3500设置告警反转导致主控不停反复复位的问题
Optix OSN3500合理设置网元的性能监视参数并启动对该网元的性能监视,可获得该网元在运行过程中的详细性能记录,便于维护人员监控、分析网元的运行状态。当SDH性能统计数值达到一定的限值(SDH性能事件门限),网元上报性能事件。当误码达到一定的限值(误码告警门限),网元上报告警事件。对服务质量要求高的业务,当某通道上监测到影响服务质量的特定事件(比如B3_EXC)后,可以在该网元相应端口插入AIS,触发相关保护机制,将业务倒换到质量更好的保护通道中,以确保这些业务的服务质量。
问题描述
OSN3500部分版本,在如下任意一个场景下,都会导致主控反复重启(一般是12分钟左右复位一次):
场景1,OSN 3500扩展子架上面的单板曾经或现在使能了告警反转功能;
场景2,OSN 3500网元主子架上面的物理单板和逻辑单板不一致,且该单板设置过或正使能了告警反转功能
告警信息
主控反复重启(一般是12分钟左右复位一次),可通过errlog命令查询
处理过程
判断方法:
该问题可以通过errlog和dbms-query:"alminv.dbf",drdb两条命令进行判断
1,如果errlog里面发现有如下记录,基本可以判断为该问题导致:
fatal task errorcode=1, Line 2069 in alm_char.cpp:TA
2,再使用:dbms-query:"alminv.dbf",drdb命令进行查询,在以下的反馈结果中,"4d"和"57"表示存在
上面的场景1,"ff"表示存在上面的场景2
:dbms-query:"alminv.dbf",drdb
ALMINV.DBF
record num BID OPPORT PATH ALLOW
1 ff 01 0001 01
2 05 02 0001 01
3 05 03 0001 01
4 05 04 0001 01
5 05 05 0001 01
6 4d 06 0001 01
7 57 07 0001 01
紧急解决:
方法1,如果现网上面告警反转功能还是使能,可以关闭该告警反转功能后,更换一块全新的主控板(如果现网上面是双主控,需要将双主控全部拔掉),然后使用T2000进行配置数据上载;
方法2,在网元正常运行时,检查到告警反转数据库有扩展子架槽位的BID情况下,需要删除掉告警的反转数据库,避免复位后出现网元反复复位,执行下面操作恢复。
:dbms-get-autobackup //(1)
:dbms-set-autobackup:disable; // 查询(1)的结果为enable,才设置为disable
:dbms-get-cyclebackup //(2)
:dbms-set-cyclebackup:disable;// 查询(2)的结果为enable,才设置为disable
:dbms-delete:"alminv.dbf",drdb
:dbms-copy-all:drdb,fdb0
:dbms-copy-all:drdb,fdb1
:dbms-query:"alminv.dbf",fdb0
:reset
:dbms-query:"alminv.dbf",drdb
:dbms-set-autobackup:enable; // 查询(1)结果为enable,需要恢复回原来的状态
:dbms-set-cyclebackup:enable; // 查询(2)结果为enable,需要恢复回原来的状态
方法3:升级到解决了该问题的如下版本:
V版本 T版本
OSPV100R007C03 T15及以后版本
OSPV100R008 B01D及以后版本
OSPV100R009 B01D及以后版本
故障原因
该问题为平台版本缺陷,涉及到的平台版本为:
OSPV100R007C02T18D02及以前版本
OSPV100R007C03T13D02及以前版本
OSPV100R008B01C及以前版本
OSPV100R009B01C及以前版本
平台版本可以通过命令行: sys-get-ptsoftver进行查询;
注:该问题不止影响OSN 3500产品,其它光网络产品如果使用了以上平台,都存在该问题隐患
建议与总结
对于该问题,如果在以上版本,建议不在扩展子架上面设置告警反转功能;
该问题影响使用了以上平台版本的所有光网络设备。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:华为OSN3500设备时钟倒换过程中上报LTI告警 2019-9-5
- 下一篇:OSN1500主控板文件不一致导致NESOFT_MM告警 2019-9-5