华为OSN350设备多光口配置多复用段恢复时业务中断问题
问题描述
华为OSN350设备,在SLQ16等线路板的2个光口上面同时配置复用段环保护。一日,这2个复用段同时发生复用段保护倒换,倒换时业务正常,但是在等待恢复时间后,只有一个复用段正常恢复到Idle态,另一个MSP保护组一直处于Switch态。
告警信息
MS_APS_INDI_EX
处理过程
客户对全网停启MSP协议后,业务恢复。
根因
如附件里面图示所示:
图1是当光口3的新k中断处理完之后,光口1的新k中断产生,然后处理此中断。正常流程下,没有问题。
图2是当光口3的新k中断处理过程中,此时还没有读清中断寄存器,光口1的新k产生,此时不会产生中断,但是会将光口1的新k中断状态位(每一个光口的每一个复用段光口占用一个位来表示中断状态)置位。因此此时的两个光口的新k是能够处理的。
图3是当光口3的新k中断处理过程中,当读清新k中断的命令下发之后,由于读清的时候拉高电平需要一段时间,此时如果来了光口1的新k,FPGA会将电平拉底,但是cpu没有检测到下降沿,不会产生新k中断 。 此时光口1的新k就丢了。
建议与总结
对于多光口板上面的多个光口都配置复用段保护,如果这多个光口同时发生复用段保护,然后同时进行复用段保护恢复,有很大的几率(实验室测试超过50%的几率)导致复用段恢复时的K字节丢失,复用段协议状态出错(一端是Idel态,一端是Switch态),业务中断。对异常复用段全网进行复用段协议重启,K字节将重新正常上报,业务恢复正常。
建议现网尽量不要在多光口板上面同时配置多个复用段保护(R8C02SPC200版本及以后时间发布的版本解决了该问题,之前时间发布的所有版本都有该问题);如果一定要进行这样的配置,建议将不同复用段的倒换等待恢复时间设置成不一致,也可规避解决该问题。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:华为OSN3500设备升级后PQ1支路部分2M端口不可用 2018-12-12
- 下一篇:华为OSN3500设备光模块接触不良导致收光功率显示异常 2018-12-12