华为OSN3500设备时钟倒换过程中上报LTI告警
问题描述
详细组网图请参见附件描述,华为OSN3500设备环形组网,-----NE1-12(slot11)-------(Slot8)NE1-23(Slot11)-----(Slot8)NE1-13-------,所有光纤不是通过光纤直接相连,中间都通过了西门子波分设备跳接,全网时钟都为扩展SSM协议,NE1-23开始跟踪NE1-12方向的时钟。现场工程师反馈在断开NE1-12与NE1-23之间的光纤时,NE1-23时钟先倒换到内部时钟源,过一段时间后再倒换到NE1-13网元方向的线路板上。
告警信息
LTI, S1_SYN_CHANGE
处理过程
1、首先怀疑时钟配置上存在问题,经过对MO进行恢复、分析,整个环上的网元都已经开启扩展SSM协议,且中心网元的时钟ID都已经设置后,并且从问题现象看,时钟源倒换到内部时钟后30秒左右还是可以倒换到另外一个方向的,因此初步排除为时钟配置上的问题;
2、怀疑中间通过的西门子波分设备对光信号处理存在延迟,但是一线在环上的其它站点进行测试,时钟可以立即倒换,初步排除该疑点;
3、怀疑NE1-23站点交叉板上面存在故障,但是在进行交叉倒换后,故障现象依旧;
4、一线再次进行测试,然后让一线采集了时钟的部分数据,通过对数据进行分析,终于发现问题发生的原因,具体请见原因分析部分的描述。
根因
具体描述请参见附件
从返回的数据看,可以判断时钟情况是正常的。只是在LTI告警的上报上存在一些不合理:LTI告警都是在S1SYNCCHANGE告警之后才上报或结束上报;实际上s1syncchange告警有7-8秒的固定延迟。对于这种情况,看clknotracemode告警比较准确。
导致该问题的原因,另外一点比较重要的是:假设一个网元有两个线路时钟源A&B,当时钟源A有故障倒换到时钟源B,A时钟源故障排除,那么默认有一个5分钟的恢复时间,那么在这5分钟里面,如果时钟源B存在故障,那么在倒换恢复时间结束之前,时钟源将不会跟踪B的时钟,而是倒换到内部时钟源。听研发说这个机制是按照建议做的。这个问题应该是两端短时间内两个时钟源上面都上报RLOF导致。
建议与总结
大家需要了解时钟倒换与业务倒换上面的区别,业务倒换时,只要备用通道,不管倒换恢复时间是否已经到了,都会倒换到备用通道;而时钟倒换,需要在备用通道的倒换恢复时间到期后,才会倒换到备用通道上面去。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:华为OSN3500传输设备扩展子架的AUX单板软件显示错误 2018-12-13
- 下一篇:华为OSN3500设备配置SNCP业务提示保护组不完整 2018-12-12