OSN3500分组业务故障处理
方法介绍
OSN3500 ETH-OAM是一种基于MAC层的协议,它通过发送OAM协议报文来检测以太网链路。ETH-OAM协议作为低速率协议,所占用的网络带宽很小,通常不会对链路所承载的业务造成影响。
ETH-OAM与现有网络维护和故障定位手段相比,有如下优势:
l 可以在不同数据封装格式(如GFP与HDLC等其他封装格式)之间进行测试。
l 可以有选择性地对某一业务流进行环回。
l 能够主动发现硬件故障类的问题。
l 能够实现故障自动检测和定位。
ETH OAM的应用包括以太网业务OAM和以太网端口OAM,如图3-1所示。
图1-1 以太网业务OAM和以太网端口OAM的应用
l 以太网端口OAM:
遵循IEEE 802.3ah OAM标准,其应用不针对具体的业务,它关注EFM(Ethernet in the First Mile,Ethernet最后一公里)的两台直连设备之间的点到点以太网链路维护,主要用于CE网元和数通设备。
以太网端口OAM的各项功能如下:
− OAM自动发现
两端设备通过定时交互的“信息OAMPDU(OAM Protocol Data Unit)”,获取对端对IEEE 802.3ah OAM协议的支持能力。只有当OAM自动发现成功后,才能在端口上进行链路性能监控、故障检测、环回操作。如果发现失败,会上报“ETHOAM_DISCOVER_FAIL”告警。
− 链路性能监控
在以太网端口上使能了IEEE 802.3ah OAM协议后,端口就周期性查询硬件芯片的RMON统计计数,获取正确报文个数、错误报文个数等信息。链路性能监控功能即是通过对这些信息的分析,能够对链路的误码性能(错帧或者错误信号)根据用户在网管上设置的门限值及窗口值进行监控。
如果产生了某种性能事件,本端就通过“事件通知OAMPDU”将该信息通知对端,对端设备收到通知后就上报“ETHOAM_RMT_SD”告警,提示维护人员进行处理。
− 故障检测
以太网端口OAM把本端检测到的故障(包括链路故障、致命故障、紧急事件),通过OAMPDU定义的Flag Field传送给远端,从而实现故障对告。
− 远端环回
本端的OAM实体可以向远端OAM实体发送“环回控制OAMPDU”报文来要求对方进行环回,通过分析发送出去的报文个数和环回回来的报文个数,就可以检测从环回发起端到环回响应端的这段链路双向的性能和故障。
− 自环检测
以太网业务处理单板使能自环检测功能后,可以检测到一个端口的发送方向的光纤连到自身接收方向的端口的自环情况,以及同一单板内两个端口相连的板内环回情况。检测到上述两种自环情况后会有告警上报,也可以进一步对发生自环的端口作阻塞的处理。
当一个端口使能了自环检测功能后,就从该端口上以每秒一个报文的频率向外发送自环检测报文。
l 以太网业务OAM:
遵循IEEE 802.1ag OAM标准,其应用是以业务为基础的,它以“维护域”为单位实现端到端的以太网业务链路检测,主要用于CE网元和PE网元。
以太网业务OAM的各项功能如下:
− 连通性测试
CC(Continuity Check,连通性测试)可以实现单向意义上的对链路状态的检测。由于连通性测试的定时检测机制,一旦设置成功便进行自动检测,从而实现了链路故障检测、故障自动发现。另外,基于CC实现的广播协议报文,可以完成一对多及多对多的网络检测(特别是二层交换网络中的应用),实现了整个维护域的网络化检测。
− 环回测试
LB(Loopback,环回测试)可以实现由源端MEP(Maintenance association End Point)到维护域内任一MP(Maintenance Point)链路状态的检测。和连通性测试相比,环回测试实现的是一次性检测,每次检测都需要人工下发命令。
− 链路追踪测试
LT(Link Trace,链路追踪测试)在环回测试的基础上进一步强化了故障定位的能力,能够实现一次定位故障网络段。
− OAM_Ping测试
OAM_Ping测试提供了对业务因误码导致的丢包率和时延时间的在线测试方法,在检测连通性的基础上实现了对以太网MAC层的链路性能的精细化管理。
以太网端口OAM的各项功能的应用场景如表3-1所示。
表1-1 以太网端口OAM的各项功能的应用场景
OAM类型 |
作用 |
应用场景 |
链路性能监测 |
检测到本端接收侧链路的误码性能(错帧或者错误信号)并通知对端设备 |
实时监测链路业务性能 |
故障检测 |
检测到本端故障后通知对端设备 |
实时监测对端故障 |
远端环回 |
定位故障点和链路性能测试 |
现场定位问题 |
自环检测 |
检测端口环回和板内环回 |
自环检测 |
以太网业务OAM的各项检测功能的应用场景如表3-2所示。
表1-2 以太网业务OAM的各项检测功能的应用场景
OAM类型 |
作用 |
应用场景 |
CC |
检测单向连通性 |
实时检测链路状态 |
LB |
检测双向连通性 |
单端定位或单端检测 |
LT |
定位故障点 |
现场定位问题 |
OAM_Ping |
检测业务丢包率和时延 |
实时检测业务性能 |
l ETH-OAM不能和MPLS OAM混合使用。
l ETH-OAM不能在专网业务模型下使用。
应用示例
图1-2 ETH-OAM应用示例组网
故障现象:如图3-2所示的组网, BSC/RNC和BTS/NodeB之间业务中断。
原因分析: OptiX OSN 3500和OptiX OSN 1500之间的链路可能故障。
故障定位:可以使用ETH-OAM的LB功能进行测试,测试过程如下:
2. 在OptiX OSN3500对应的以太网端口创建维护点1,方向选择Ingress方向。
3. 在OptiX OSN1500对应的以太网端口创建维护点2,方向也选择Ingress方向。
4. 从维护点1发起到维护点2的LB测试。
如果LB测试显示成功,那说明这一段传输路径是正常的。
- 上一篇:华为OSN3500升级包加载失败处理过程 2018-5-19
- 下一篇:OSN3500 配置EPL业务示例 2018-5-19