摘要:计算机网络技术发展迅猛,越来越多的企业业务依靠网络完成,对网络的安全性和可靠性提出更高的要求,一旦网络瘫痪,可能意味着损失大量的资金,更有甚者导致公司破产。
关键词:网络故障排除
0引言
如今因特网是极其庞大和复杂的,尽管其形式和内容都在发生巨大的变化,但是网络在初期设计和建造中,都采用分层次的结构,这种体系结构使得各种不同硬件和软件快速连接到网络,网管员在分析和排查网络故障时可充分利用这种分层结构,快速准确的定位并排除故障,达到事半功倍的效果,本文就对如何分层排除网络故障作以介绍。
1系统化排错策略
网络故障排除是一门综合性技术,涉及到网络技术的方方面面,所以当听到“网络瘫痪了”,对于网络管理员来说,首先应该是镇定,其次开始第一步,分析网络故障时,首先要清楚故障现象,应该详细说明故障的现象和潜在的原因,然后确定造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。WwW.lw881.com第二步,收集需要用于帮助隔离可能故障原因的信息,如向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。第三步,根据收集到的情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放软件原因上。对于任何机会都应该设法减少可能的故障原因,以至于尽快的策划出有效的故障诊断计划。第四步,根据最后的可能的故障原因,建立一个诊断计划,开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑一个以上的故障原因,试图返回故障原始状态就困难的多了。第五步,执行诊断计划,认真做好每一步测试和观察,直到故障症状消失。第六步,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到解决。网络故障的发生时很常见的事情,而对于网络管理员来说,就是去解决这种网络故障,恢复网络运行,改善和优化网络的性能。因此部署一种能够排除不同可能性并一步一步朝网络问题的真实原因前进的技术方案是非常关键的步骤,一个较好的故障排查方案图如下:
2分层排错
网络的故障到底出在什么地方?这对于很多初级网络管理者来说是一件麻烦的事情,但是对于网络来说,为了降低设计的复杂性,增强通用性和兼容性,计算机网络都设计成层次结构。这种分层体系使多种不同硬件系统和软件系统能够方便地连接到网络。管理员在分析和排查网络故障时,应充分利用网络这种分层的特点,即根据osi七层结构的定义和功能逐一的分析和排查这是最好最快的方法。osi的层次结构为管理员分析和排查故障提供了非常好的组织方式,由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。在应用分层思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指从物理层开始检查直到应用层;自上而下是指从应用协议中捕捉数据,分析数组统计数据和流量统计信息以获得有价值的信息。osi把网络分成了七层,从下至上(1层到7层)分别为物理层、数据链路层、网络层、传输层、会话层、表示层、应用层,这七层模型描述了信息如何通过网络介质从一台计算机的软件应用传输给另一台计算机的软件应用,这七个层次相对独立,完成相应的网络功能。osi的上层(5至7层)处理应用问题,并且通常只实现在软件中。应用层最靠近终端用户。osi的下层(1至4层)处理数据传输问题。物理层和数据链路层实现在硬件和软件中。网络层和传输层一般只实现在软件中。①在查看物理层时,此时应该做的第一件事情就是检查网络线路。计算机后面的网卡绿色指示灯是否亮?很多情况下,你会发现这仅仅是线路存在问题。你可能也遇到过比较罕见的情况,由于线路接口比较松,加上用户的经验不足,所以看上去是插着的,但实际上并没有接触。因此应注意连接电缆是否正确,modem、csu/dsu等设备的配置及操作是否正确,确定路由器、交换机、防火墙等设备接口是否完好的主要通过showinterface命令,检查每个端口是否up,查看传输模式、传输速度、协议建立状态等。②在确保物理层完好的情况下,应特别注意数据链路层,因为所有网络层及网络层以上的应用都建立在数据链路层的正常工作。数据链路层主要关注于相连设备的互连参数,比如封装协议、信令格式等。③网络层是计算机通信的关键层,因此网络层检查时要注意利用ping命令和traceroute命令检查网络的连通性。网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的ip地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括rip或者igrp路由协议出现的故障。④在协议层的高层涉及到协议故障比较多,故障处理起来越来越困难,因此管理员需要懂得协议之间如何工作。首先管理员应清楚有那些程序可用,可以利用telnet终端模拟应用程序,它可以提供对大型主机、unix系统、路由器、交换机等的应用程序和相关配置的命令行访问方式。同时可以使用端口扫描器判断哪些端口正在使用,以及借助协议分析仪(如微软提供的网络监视器)捕捉相应的rip信息和udp报头,大多数传输层错误主要表现在acl和nat上面。另外日志对于网络安全来说非常重要,记录了系统每天发生的各种各样的事情,你可以通过日志来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹。路由器的一些重要信息可以通过syslog机制在内部网络的unix主机上作日志。在路由器运行过程中,路由器会向日志主机发送包括链路建立失败信息、包过滤信息等等日志信息,通过登录到日志主机,网络管理员可以了解日志事件,对日志文件进行分析,可以帮助管理员进行故障定位、故障排除和网络安全管理。当网络故障排除后,管理员应及时做好记录,以便日后查看和使用。⑤而对于应用层来说,可以使用程序本身进行调试和排错。
3 总结
企业网络是个复杂而庞大的体系,任何一个细小的错误都可能导致整个网络的瘫痪,对于网络管理员来说,要从故障现象出发,以各种手段收集更可能多的信息,确定故障点,制定各种排错的计划并执行,直至排除故障。随着计算机网络体系的不断壮大,也会越来越复杂,但是万变不离其宗,那就是按照分层次结构去排查,同时将所掌握的知识有条理的系统的方式应用到诊断和排除网络故障中去,就可以达到事半功倍的效果。
参考文献:
[1]秦东.企业网络故障.电子工业出版社.2007.6.1.
[2]顾巧论.计算机网络安全.科学出版社.2005.7.
[3]cormacs.longcisco网络互连与故障排除.机械工业出版社.2005.7.