OSN3500二纤双向复用段共享保护环发生时隙错连导致二纤单向通道保护环失效
问题描述
图1
背景描述,铁路系统常见网络拓扑如图1所示,大站传输室OSN3500组成大环,采用两纤双向复用段共享保护,如图中的A-F-G-H-I-J-O-P-Q-R-S-A,小站OSN2000设备组成单向通道保护环,如图中的A-B-C-D-E-F-A、J-K-L-M-N-O-J。本案例中复用段环容量为2.5G(#1-#8 VC4工作,#9-#16 VC4保护);通道环容量为622M,通道环共享2.5G复用段2.5G光口的#1-#4 VC4,即通道环在与复用段的重复的段落,光口是相同的,共享了#1-#4 VC4时隙,例如A-F之间,O-J之间。
铁路TDCS业务信号特点为两两站点之间开放业务,如A-B,B-C,C-D,D-E,E-F两两之间开放一条E1业务,A和F再各开放一条E1电路到NC核心局点(铁路系统上称A和F回核心局点的电路为抽头电路),可以看出OSN2000之间的业务通过通道环保护,A和F到NC的业务通过复用段环保护。B点到A、C的两个方向的E1业务分别接不同的协议转换器换成以太网信号,以太网信号再接入同一台路由器,A、C、D、E、F与B相同,这样, A-B-C-D-E-F组成了一条“手拉手”形态的一组电路,通过路由器的路由功能,将各站点的信号全部传到NC核心路由器上,在业务层面上,又形成了一重保护。
5月16日1:13分,NC网管中心发现复用段环A-F发生光路中断(后经检查为偷盗),复用段环正常倒换,业务未受影响。O-J之间5月16日原计划要进行光缆割接,值班人员判断A-F之间光路中断不影响割接操作,未叫停割接,1:55分,O-J段落开始光缆割接,割接开始后,造成J站沿如图逆时针(包括KLMN)一直到F站(包括BCDE)的TDCS业务全部中断。但是NMLKJ,ABCDEF的低阶业务无TU-AIS告警。经过分析,O-P-Q-R-S-A 之间OSN2000的TDCS电路,因为抽头电路所经的复用段出现双断,业务无法传回NC,为正常情况。客户认为JKLMNO和ABCDEF两个通道环的业务在O-J,A-F之间发生光缆中断的情况下,仍有通道保护,抽头电路仍可通过J,F传回NC,保证这两段“手拉手”电路的正常,但实际情况是中断了,需要给出原因。
告警信息
光板R-LOS,复用段倒换告警,通道保护环倒换告警。
处理过程
客户2:20抢通O与J之间的光缆纤芯,业务恢复。4:15抢通了A到F之间的光缆,全部倒换告警消失。
根因
图2
如图2所示,以C-D之间业务为例进行分析,在正常情况下,因为保护环属性为单向通道保护环,C收D选收信号2(蓝色标示数字2),D收C选收信号1,信号1(C→D)的VC12时隙为VC4:2:12,信号2(D→E→F→A→B→C)的时隙全程为VC4:2:12。
图3
如图3,当A-F光缆中断,因为通道保护环不需要协议,能够实现快速的倒换,D收C保持不变,仍选信号1,C选D快速地倒换选收了信号3;与此同时复用段发生了倒换,A、F进入桥接、倒换态(桥接发生在R-LOS侧,如图3所示),其余站点为穿通态,这样在50ms以内,D到C的工作信号路由变为D→E→F→G→H→I→J→O→P→Q→R→S→A→B→C, 其中D→E→F的时隙仍为VC4:2:12, F→G→H→I→J→O→P→Q→R→S→A的时隙为VC4:10:12, A→B→C的时隙为VC4:2:12,经过通道环默认的WTR 600s后,C收D的信号倒换为选收信号5。在以上两次倒换过程中,业务均正常,不受影响。
图4
L与K之间开通的E1业务,全程所占用的VC12时隙,两个方向(信号6:L→K,信号7:K→J→O→N→M→L)也都是VC4:2:12。
如图4,当O-J发生光路中断,则O、J会收到R-LOS告警,该告警会触发O和J发生倒换,由穿通态变为桥接态,图3中的信号5会发生瞬断,C收D的信号立即选收信号3。D到C的单向业务路由会发生变化,原信号5(D→E→F→G→H→I→J→O→P→Q→R→S→A→B→C),因为J发生桥接倒换,J发O方向的 VC4:10:12被桥接回J收O方向的VC4:2:12,而该时隙恰好是原信号7的时隙,该时隙经J站的交叉连接,被送到K站落地,所以D到C的单向业务信号就变成了D→E→F→G→H→I→J→K,一条完整的信号流送到了K站,所以K站并不会报告警。那么,在此看来,如果C站收不到信号应该会报TU-AIS,我们再继续分析,L站原发往K站的保护业务(粉色),信号传送到O站时,在O站做了桥接,VC4:2:12桥接到VC4:10:12,信号沿着P-Q-S-R-S-A,在A站,信号又从VC4:10:12被桥接到VC4:2:12,而该时隙恰好是原先信号4的时隙,信号经B送到了C,即路由为图中信号9(L→M→N→O→P→Q→R→S→A→B→C),这样,C站同样收到了一条完整的信号,也不会上报告警,在通道环经过WTR 600s后,C收D的信号倒换到信号9,这样就造成了业务中断,同时没有TU告警。
根据分析,问题的根本原因找到,因为单向通道保护环共享了复用环上的时隙,复用段出现两次断纤时,二纤双向复用段共享保护环无法实现对该环上低阶业务级别的压制(目前二纤双复用段环对低阶业务级别的压制条件要求非常苛刻),故产生时隙错连现象,而单向通道保护环虽有另一个方向全程光路是正常的,但无法发挥保护的作用,导致通道环上的两两站点之间的业务实际是中断状态,该问题比较隐蔽。
建议与总结
本案例主要分析了单向通道环共享复用段时隙造成的整个环上的两两节点之间业务中断的根本原因,根据这个原因,提出两点建议:1、将单向通道环与复用段环分开,分为不同的光板,这样复用段环的时隙错连现象将不会影响到单向通道环;2、将单向通道保护环改为双向通道保护环或SNCP环,并设置短路径为工作路由,长路径为保护路由。以上两个方法采用一种即可规避问题。
同时建议用户加强防范,在复用段环出现一处光缆中断时,应停止其它段落的割接操作,降低风险。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:OSN3500设备的那些SDH单板支持温度检测功能 2018-11-26
- 下一篇:SDH传输设备不同智能域智能网元无法端到端创建SPC智能业务 2018-11-26