【摘 要】“网管专家服务”,是利用中国电信统一建立的客户网络监控管理平台,以实时主动的方式,对包含客户端cpe设备在内的客户广域网络提供端到端的网络监控和管理的业务。本文在简单概述“网管专家服务”的基础上,详细分析了其技术原理及关键技术、研究启示。
【关键词】网管专家服务 snmp 关键技术研究
1 引言
abc公司的各分支机构遍布全国,各分支与总部之间和各分支相互之间有多种业务,每种业务对网络要求都不一样,有些业务(如voip、 erp等)对于网络质量有比较高的要求,因此中国电信建议abc公司选用中国电信新一代网络“ip虚拟专网”组建全新的企业业务网络,中国电信同时为客户提供远程的网络监控及管理服务——中国电信网管专家服务。
网管专家服务主要基于cpe到cpe的管理,并针对“ip虚拟专网”提供个性化的性能指标监控和管理,根据abc公司的网络情况,中国电信建议为abc公司管理全国的专线线路和网络设备,并每月提供相应的网络运行分析报告。它以“一点接入、全网监控”的方式,7*24小时实时监控客户的端到端网络性能状况和故障情况,主动发现和处理客户网络故障,并及时主动通知客户,定期向客户提供网络运行及优化分析报告,同时,通过“大客户贴心服务系统”web界面,客户能自主地透明查看其网络的实时运行状况及故障处理阶段状态,并可按客户需求提供cpe设备现场服务、顶替服务或租赁服务,从而为客户提供差异化、高增值的广域网络监控管理外包服务。
2 服务技术原理及关键技术研究
网管专家服务采用标准的snmp协议和icmp获取客户网络的网管信息。www.133229.cOm网管专家服务数据中心的polling server每30秒ping被管理设备;每5分钟主动获取设备的cpu, memory, interface信息(不同厂商设备cpu, memory和interface的oid不一样);被动检听设备的snmp traps,立即响应。2.1 snmp原理
基于tcp/ip的网络管理包含两部分:网络管理站(也叫管理进程,manager)和被管理的网络单元(也叫被管设备)。被管设备种类繁多,例如:路由器、x终端、终端服务器和打印机等。这些被管设备的共同点就是都运行tcp/ip协议。被管设备端和管理相关的软件叫做代理程序(agent)或代理进程基于tcp/ip的网络管理包含3个组成部分:
一个管理信息库mib(management information base)。管理信息库包含所有代理进程的所有可被查询和修改的参数。
关于mib的一套公用的结构和表示符号。叫做管理信息结构smi(structure of management information)。
管理进程和代理进程之间的通信协议,叫做简单网络管理协议snmp(simple network management protocol)。
关于管理进程和代理进程之间的交互信息,snmp定义了5种报文:
get-request操作:从代理进程处提取一个或多个参数值。
get-next-request操作:从代理进程处提取一个或多个参数的下一个参数值。
set-request操作:设置代理进程的一个或多个参数值。
get-response操作:返回的一个或多个参数值。这个操作是由代理进程发出的。它是前面3中操作的响应操作。
trap操作:代理进程主动发出的报文,通知管理进程有某些事情发生。
前面的3个操作(get-request、get-next-request、set-request)是由管理进程向代理进程发出的。后面2个(get-response、trap)是代理进程发给管理进程的。
snmp(简单网络管理协议)是用来管理网络设备时的国际标准协议,通过对网络设备mib(管理信息库)中的具体参数的查询和设置,可以实现对网络设备的管理。例如:对许多启用了标准snmp协议的网络设备(如cisco交换机、路由器等)的接口信息,不但能使用前面介绍的snmp的get操作获得接口状态的up或down的信息,而且可以使用set操作来设置接口的up或down状态。这就是使用snmp协议对网络设备进行管理的技术实现原理。2.2 icmp原理
icmp是“internet control message protocol”(internet控制消息协议)的缩写。它是tcp/ip协议族的一个子协议,用于在ip主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息。这些控制消息虽然并不传输用户数据,但是对于用户数据的传递起着重要的作用。
经常使用的ping命令的执行过程实际上就是icmp协议工作的过程。ping (packet internet grope),用于测试网络连接量的程序。基于icmp协议的ping命令是个使用频率极高的实用程序,用于确定本地主机是否能与另一台主机交换(发送与接收)数据报。根据返回的信息,我们就可以推断tcp/ip参数是否设置得正确以及运行是否正常。
按照缺省设置,ping命令发送4个icmp(网间控制报文协议)回送请求,每个32字节数据,如果一切正常,我们应能得到4个回送应答。 ping能够以毫秒为单位显示发送回送请求到返回回送应答之间的时间量。如果应答时间短,表示数据报不必通过太多的路由器或网络连接速度比较快。ping还能显示ttl(time to live存在时间)值,我们可以通过ttl值推算一下数据包已经通过了多少个路由器:源地点ttl起始值(就是比返回ttl略大的一个2的乘方数)-返回时ttl值。如果某些ping命令出现运行故障,它也可以指明到何处去查找问题。2.3 netflow技术
netflow技术首先被用于网络设备对数据交换进行加速,并可同步实现对高速转发的ip数据流(flow)进行测量和统计。经过多年的技术演进,netflow原来用于数据交换加速的功能已经逐步由网络设备中的专用asic芯片实现,而对流经网络设备的ip数据流进行特征分析和测量的功能也已更加成熟,成为了当今互联网领域公认的最主要的ip/mpls流量分析和计量行业标准,同时也被广泛用于网络安全管理。利用netflow技术能对ip/mpls网络的通信流量进行详细的行为模式分析和计量,并提供网络运行的准确统计数据,这些功能都是运营商在进行网络安全管理时实现异常通信流量检测和参数定性分析所必需的。
由于ip网络的非面向连接特性,网络中不同类型业务的通信可能是任意一台终端设备向另一台终端设备发送的一组ip数据包,这组数据包实际上就构成了运营商网络中某种业务的一个数据流(flow)。通过分析ip数据包的不同属性(源ip地址、目标ip地址、协议类型)来进行流量分析。可以快速区分网络中传送的各种不同类型业务的flow。对区分出的每个数据流netflow可以进行单独地跟踪和准确计量,记录其传送方向和目的地等流向特性,统计其起始和结束时间,服务类型,包含的数据包数量和字节数量等流量信息。对采集到的数据流流量和流向信息,netflow可以定期输出原始记录,也可以对原始记录进行自动汇聚后输出统计结果。2.4 saa
服务保证代理(saa)是service assurance agent的简写,saa为整个网络提供了针对服务级别的管理。允许检测应答时间、网络资源、有效性、跳动、连接时间、数据包丢失和应用程序工作情况,允许用户监控网络性能,还可通过测试响应时间来判断程序性能。利用这些功能,管理员能进行故障修复,问题公告,问题分析等操作。通过saa业务定期执行,可以真实的衡量网络性能。各种性能衡量尺度包括包来回响应时间、连接时间、丢包率、应用性能等等。这些特点使用户得到通知并迅速解决问题,同时基于saa收集的数据进行问题分析。
saa同时支持帧中继、voip、mplsvpns等。saa帧中继业务允许用户可以衡量响应时间、帧丢失率、帧中继pvc数据完整率这些参数。通过测量这些参数,服务商可以确定路由协议是否正常工作,是否满足用户的需求。saa的增强功能允许用户将saa业务应用到mpls vpn pe路由器上,saa业务允许服务商向用户提供设计、供给和管理ip vpn的服务。
参考文献:
[1]岑贤道,安常青.网络管理协议及应用开发[m].北京:清华大学出版社,1998.
[3]宋兵.基于snmp的网络安全管理与通信[d].西安交通大学硕士学位论文,2003-3.