电子政务 网络管理 常见故障处理

网络故障排除常用方法

来源:网络部撰稿人:网络部发布时间:2014-03-06 字体:[] [][关闭][打印]
        一、分层故障排除法

    1、层次化的故障排除思想

    基本所有的网络技术模型是分层的。当模型的所有低层结构工作正常时,它的高层结构才能正常工作。层次化的网络故障分析方法有利于快速及准确进行故障定位。

    例如,在一个以太网网络中,由于物理层的不稳定,以太网链路经常出现间歇性中断。这个问题的直接表象是到达远程端点的路由总是出现间歇性中断。这使得维护工程师第一反应是路由协议出问题了,然后凭借着这个感觉来对路由协议进行大量故障诊断和配置,其结果是可想而知的。如果他能够从OSI模型的底层逐步向上来探究原因的话,维护工程师将不会做出这个错误的假设,并能够迅速定位和排除问题。

    2、各层次的关注点

    (1)物理层负责通过某种介质提供到另一设备的物理连接,包括端点间的二进制流的发送与接收,完成与数据链路层的交互操作等功能。

    (2)数据链路层负责在网络层与物理层之间进行信息传输:规定了介质如何接入和共享;站点如何进行标识;如何根据物理层接收的二进制数据建立帧。

    封装的不一致是导致数据链路层故障的最常见原因。当使用display interface命令显示端口和协议均为up时,我们基本可以认为数据链路层工作正常;而如果端口up而协议down,那么数据链路层存在故障。

    链路的利用率也和数据链路层有关,端口和协议是好的,但链路带宽有可能被过渡使用,从而引起间歇性的连接中断或网络性能下降。

    (3)网络层负责实现数据的分段封装与重组以及差错报告,更重要的是它负责信息通过网络的最佳路径的选择。

    地址错误和子网掩码错误是引起网络层故障的最常见的原因;网络地址重复是网络故障的另一个可能原因;另外,路由协议是网络层的一部分,也是排错重点关注的内容。

    排除网络层故障的基本方法是:沿着从源到目的地的路径查看路由器上的路由表,同时检查哪些路由器接口的IP地址是否正确。如果所需路由没有在路由表中出现,就应该检查路由器上相关配置,然后手工添加静态路由或排除动态路由协议的故障以使路由表更新。

    二、分块故障排除法

    通过display current-configuration命令可以看到H3C系列路由器和交换机等网络设备的配置文件的组织结构,该配置文件包含以下部分:

    (1)管理部分(设备名称、口令、服务、日志等)

    (2)端口部分(地址、封装、cost、认证等)

    (3)路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)

    (4)策略部分(路由策略、策略路由、安全配置等)

    (5)接入部分(主控制台、Telnt登陆、拨号等)

    (6)其他应用部分(语言配置、VPN配置、QOS配置等)

    上述分类给故障定位提供了一个原始框架,当出现一个故障案例现象时,我们可以把它归入上述某一或某几类中,从而有助于缩减故障定位范围。

    例如,使用display ip routing-table命令时,输出结果只显示了直连路由,没有其他路由。那么问题可能发生在哪里呢?查看配置文件分类,其中与路由相关的有三部分:路由协议、策略、端口。如果没有配置路由协议或配置不当,路由表就可能为空;如果访问列表配置错误,就可能妨碍路由的更新;如果端口的地址、掩码或认证配置错误,也可能导致路由表错误。

    三、分段故障排除法

    当一个故障涉及的范围较大,可以通过分段故障排除法来将故障范围缩小。例如,某个厅局单位采用交换机组网,用户通过政务外网访问互联网,如果用户反映无法访问互联网业务,可以按照如下分段,依次进行故障排除:

    1、主机到接入交换机这一段

    2、接入交换机到政务外网核心交换机这一段

    3、政务外网核心交换机到防火墙这一段

    4、政务外网互联网出口问题

    四、替换法

    替换法是我们检查硬件是否存在问题最常见的方法。例如,当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其他接口模块试一试。