OSN3500单主控下载过程分析
问题描述
某日用户自行更换OSN3500单主控过程中,采用“中断模式”下载,业务发生16S的闪断。用户要求在实验环境进行OSN3500单主控板下载的测试。
告警信息
TU_AIS。T2000版本为V2R6C03,OSN3500版本为5.21.13.47
处理过程
下载过程分析如下:
1、下载过程中在初始化网元步骤,主控数据被清空,进入安状态。此时不向单板下发配置,业务不中断
2、创建完单板和动态端口后创建MSP环保护组,然后下发校验命令,此时配置会下发单板,业务开始中断
3、SDH业务分包下载,T2000以每包200条交叉的数量下发OSN3500设备,每个包的业务下载完成后校验一次,待主机反馈成功后再进行下一包的下载。随着每包业务的校验成功,涉及的SDH业务开始恢复。待SDH业务全部下载完,SDH业务全部恢复。
4、交叉连接的下载顺序是随机的。网管代码中没有保证交叉ID小的先下发。
具体见附件
根因
和用户交流,T2000“中断模式”下载对于5.0平台设备业务中断时间是比较长的。通过下载测试,得出如下结论:
OSN3500下载过程中,如果采用常规模式。SDH业务中断时间具有一定随机性。在下载完环形复用段、线性复用段等保护后开始下载SDH业务,SDH业务是分包下载,分包校验的。每一包估计在200条左右(估计值,仅供参考),在最后一包下载完成并校验成功后SDH业务全部恢复。通过几次下载尝试发现SDH业务的中断时间从十几秒~数分钟不等,网管下载顺序是随机的。从理论上讲OSN3500的下载模式改为“非中断模式”可使SDH业务不受影响。也就是说非中断模式下载业务, SDH业务中断时间<=50mS。
业务不受影响有几个条件:
1、主机和业务单板的版本须配套的。
2、网管的业务配置须和网元当前的配置一致。
3、网元上所有的保护组不能处于倒换态。
4、下载过程中网元不要出现诸如复位、断纤等其他异常。
网管下载过程中操作失败的风险较大。网管下载方式恢复业务的方案主要是为了故障恢复,最多的应用场景是主控更换单板。建议主控主备双配,可有效减少下载操作的概率,将大大减少网管下载带来的风险。
建议与总结
由于运营商对业务中断的考核越来越严格,要求更换主控板业务不受影响。对于Metro设备建议完善下载机制,做到SDH业务中断时间<=50mS;
对于OSN3500设备单主控除了完善下载机制,做到SDH业务中断时间<=50mS外。在市场配置时就按照主控双配来做。
- 上一篇:OSN3500传输设备上报LCAS_FOPT告警 2018-5-25
- 下一篇:Metro3000在不中断穿通业务的情况下替换MSP环上设备 2018-5-25