OSN3500设备DCN概率丢包导致Hybrid MSTP网络扩容失败
问题描述
2011年3月24日晚扩容在NE1228和NE1229之间加入NE1250, 在使用TCAT工具操作的时候发现命令下发有停留、延时的情况,最后命令没有下发成功,由软件自动倒回,业务未受影响。现网设备版本为华为SDH设备 OSN3500V2R11C00SPC200(5.21.31.35),网管版本为U2000V100R002C00SPC003。TCAT工具与网管版本配套为V100R002C00SPC003。
处理过程
分析TCAT工具下发命令存在停留、延时的原因:一是可能工具、网管和相互配套的问题;二是可能在命令下发的管道侧问题,即DCN通信问题;三是设备主控的问题导致响应超时。分别分析如下:
1、核对工具和网管的配套关系是OK的,换了一台便携机安装工具与网管配套使用仍然存在相同问题。可以初步排除工具网管的问题。
2、由于TCAT工具进行扩容操作时需要对新加网元下发新建tunnel的命令,尤其是新加网元穿通的tunnel数量较多时,下发的新建命令较多,需要保证网络DCN通信正常。从NE1228和NE1229分别沿着网关网元的方向检查经过网元的DCN设置,均没有参数设置错误。从网管分别ping NE1228和NE1229网元均没有问题。ping NE1250网元发现存在概率性的丢包和响应超时的现象。经过排查发现NE1228和NE1229分别属于不同的网关网元NE1201和NE1205,NE1250在扩容之前通过SDH网络的ECC通道接入由本地员工将其网关网元设置为NE1203。于是导致NE1250既不和NE1228同属一个网关网元,也不和NE1229同属一个网关网元。将NE1250所属网关改为NE1201之后,再次ping NE1250网元时上述现象消失。
3、检查NE1228、NE1229和NE1250的设备运行状态和主控对上载备份网元数据的效率,初步判定主控响应正常。
将新加网元设置为与相邻网元同属一个网关网元,通过ping命令测试DCN通信情况。在确保ping NE1250网元没有概率性丢包和响应超时现象后,清理完毕之前扩容失败导致的离散tunnel之后,重新使用TCAT工具进行拆环加点,操作顺利进行。
根因
网关设置错误,导致DCN通信异常
解决方案
经过分析将问题聚焦在DCN通信问题上,在确保ping NE1250网元没有概率性丢包和响应超时现象后,清理完毕之前扩容失败导致的离散tunnel之后,重新使用TCAT工具进行拆环加点,操作顺利进行。
建议与总结
在扩容之前建议对整网的DCN设置情况进行一次健康检查,包括网关网元的设置、备份网关的设置、DCN通信带宽和异常情况梳理等。然后注意清理现网存在的离散tunnel,确保存在的离散tunnel不影响现网扩容网元需要穿通的tunnel。
本章相关技术资料和SDH设备故障处理流程由深圳市鼎为网络技有限公司收集整理(www.szdingwei.net),转载请保留!本公司专注华为SDH光传输设备,SDH传输设备的销售。
- 上一篇:OSN3500设备支路板故障导致网元交叉板报总线故障 2018-12-4
- 下一篇:NGSDH产品OSN3500线路板查询不到任何性能 2018-12-3