网络故障处理排除方法(网络故障处理手册大全)

全文干货无尿点,收好不谢一、网络的复杂性 ,下面我们就来说一说关于网络故障处理排除方法?我们一起去了解并探讨一下这个问题吧!

网络故障处理排除方法(网络故障处理手册大全)

网络故障处理排除方法

全文干货无尿点,收好不谢!

第一章•故障处理方法

一、网络的复杂性

一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、…

二、故障处理模型

1、界定问题(Define the Problem)

详细而精确地描述故障的症状和潜在的原因

2、收集详细信息(Gather Facts)

R>信息 ">RIP故障

RIP是距离矢量路由协议,度量值是跳数。RIP最大跳数为15,如果到目标的跳数超过15,则为不可达。

RIP V1是有类别路由协议,RIP V2是非分类路由协议,支持CIDR、路由归纳、VLSM,使用多播(224.0.0.9)发送路由更新。

RIP相关的show命令:

Show ip route rip ;仅显示RIP路由表Show ip route ;显示所有IP路由表Show ip interface ;显示IP接口配置Show running-configDebug ip rip events ;常见的RIP故障:RIP版本不一致、RIP使用UDP广播更新

四、处理IGRP故障

IGRP是Cisco专用路由协议,距离矢量协议。

IGRP的度量值可以基于五个要素:带宽、延时、负载、可靠性、MTU,缺省只使用带宽和延时。

IGRP相关的show命令:

Show ip route igrp ;显示IGRP路由表Debug ip igrp events ;Debug ip igrp transactions ;常见的IGRP故障:访问列表、不正确的配置、到相邻路由器的line down

五、处理EIGRP故障

EIGRP是链路状态协议和距离矢量混合协议,是CISCO专用路由协议。EIGRP使用多播地址224.0.0.10发送路由更新,使用DUAL算法计算路由。

EIGRP的度量值可以基于带宽、延时、负载、可靠性、MTU,缺省仅使用带宽和延时。

EIGRP使用3种数据库:路由数据库、拓扑数据库、相邻路由器数据库。

EIGRP相关的show命令:

Show running-configShow ip routeShow ip route eigrp ;仅显示EIGRP路由Show ip eigrp interface ;显示该接口的对等体信息Show ip eigrp neighbors ;显示所有的EIGRP邻居及其信息Show ip eigrp topology ;显示EIGRP拓扑结构表的内容Show ip eigrp traffic ;显示EIGRP路由统计的归纳Show ip eigrp events ;显示最近的EIGRP协议事件记录

EIGRP相关的debug命令:

Debug ip eigrp as号Debug ip eigrp neighborDebug ip eigrp notificationsDebug ip eigrp summaryDebug ip eigrp

常见的EIGRP故障:相邻关系、缺省网关等的丢失、老版本IOS的路由、stuck in active。

处理EIGRP故障时,先用show ip eigrp neighbors查看所有相邻路由器,然后再用show ip route gigrp查看路由器的路由表,再用show ip eigrp topology查看路由器的拓扑结构表,也可用show ip eigrp traffic查看路由更新是否被发送。

六、处理OSPF故障

OSPF是链路状态协议,维护3个数据库:相邻数据库、拓扑结构数据库、路由表。

OSPF相关的show命令:

Show running-configShow ip routeShow ip route ospf ;仅显示OSPF路由Show ip ospf process-id ;显示与特定进程ID相关的信息Show ip ospf ;显示OSPF相关信息Show ip ospf border-routers ;显示边界路由器Show ip ospf database ;显示OSPF的归纳数据库Show ip ospf interface ;显示指定接口上的OSPF信息Show ip ospf neighbor ;显示OSPF相邻信息Show ip ospf request-list ;显示链路状态请求列表Show ip ospf summary-address ;显示归纳路由的再发布信息Show ip ospf virtual-links ;显示虚拟链路信息Show ip interface ;显示接口的IP设置

OSPF相关的debug命令:

Debug ip ospf adj ;Debug ip ospf eventsDebug ip ospf floodDebug ip ospf lsa-generationDebug ip ospf packetDebug ip ospf retransmissionDebug ip ospf spfDebug ip ospf tree

常见的OSPF故障:OSPF的每个area不超过100台路由器,整个网络不超过700台路由器;通配符掩码配置不当;

七、处理BGP故障

BGP(包括IBGP和EBGP)的关键配置是邻居关系,BGP使用TCP建立相邻关系。

BGP相关的show命令:

Show ip bgp ;显示BGP所学习到的路由Show ip bgp network ;显示特定网络的BGP信息Show ip neighbors ;显示BGP邻居信息Show ip bgp peer-group ;显示BGP对待组信息Show ip bgp summary ;显示所有BGP连接的归纳Show ip route bgp ;显示BGP路由表

BGP相关的debug命令:

Debug ip bgp 192.1.1.1 updatesDebug ip bgp dampeningDebug ip bgp eventsDebug ip bgp keepalivesDebug ip bgp updates

八、再发布路由协议

九、TCP/IP症状和原因

症状 原因

本地主机不能与远程主机通讯:

1) DNS工作不正常2) 没有到远程主机的路由3) 缺少缺省网关4) 管理拒绝(ACL)

某个应用程序不能正常工作:

1) 管理拒绝(ACL)

2) 网络没有正常配置以处理该应用程序

启动失败:

1) BootP服务器没有MAC地址的实体2) 缺少IP helper-address3) ACL4) 修改NIC或MAC地址5) 重复的IP地址6) 不正常的IP配置

不能ping远程主机:

1) ACL2) 没有到远程主机的路由3) 没有设置缺省网关4) 远程主机down

缺少路由:

1) 没有正确配置路由协议2) 发布列表3) 被动接口4) 没有通告路由的邻居5) 路由协议版本不一致6) 邻居关系没有建立

相邻关系没有建立:

1) 不正确的路由协议配置2) 不正确的IP配置3) 没有配置network或neighbor语句4) hello间隔不一致5) 不一致的area ID

高的CPU利用率:

1) 不稳定的路由更新2) 没有关闭debug3) 进程过重

路由触发活跃模式:

1) 不一致的间隔2) 硬件问题3) 不稳定的链路

十、TCP/IP症状和行动计划

DNS工作不正常:

1)配置DNS主机的配置和DNS服务器,可以使用nslookup校验DNS服务器的工作

没有到远程主机的路由:

1) 用ipconfig /all检查缺省网关2) 用show ip route查看是否相应路由3) 如果没有该路由,用show ip route查看是否有缺省网关4) 如有网关,检查到目标的下一跳;如无网关,修正问题

ACL 有分离的问题与ACL相关:

必须分析ACL、或重写ACL并应用。

网络没有配置以处理应用程序:

查看路由器配置

Booting失败:

1) 查看DHCP或BootP服务器,并查看是否存在故障机的MAC2) 使用debug ip udp校验从主机接收的包3) 校验helper-address正确配置4) 查看ACL是否禁用包

缺少路由:

1) 在第1台路由器上用show ip route查看所学到的路由2)校验相邻路由器3)有正确的路由network和neighbor语句4) 对OSPF,校验通配符掩码5) 检查应用到接口上的distribute list6)验证邻居的IP配置7) 如果路由被再发布,验证度量值8) 验证路由被正常的再发布

没有构成相邻关系:

1) 用show ip protocol neighbors列表已构成的相邻关系2) 查看没有构成相邻关系的协议配置3)检查路由配置中的network语句4)用show ip protocol/interface查看特定的接口信息,如Hello间隔
第二章•处理串行线路和帧中继连接故障

一、处理串行线路故障

1、HDLC封装

High-level Data Link Control(HDLC)是用于串行链路的一种封装方法,HDLC是Cisco路由器串行接口的缺省封装方法。 处理串行链路故障的第一步就是查看链路两端要使用相同的封装类型。

常用命令:

Show interface serial 1 :查看接口信息

Clear counters serial number:复位接口的计数器到0

正常情况下,接口和line都是up的。

线缆故障、载波故障和硬件故障都可导致接口down,通过校验电缆连接、更换硬件(包括电缆)、检查载波信令定位问题。

接口up,line down:CSU/DSU故障、路由器接口问题、CSU/DSU或载波的时间不一致、没有从远端路由器接收到keepalive信令、载波问题。应验证本地接口和远端接口的配置。

接口重启的原因:

  • 数秒内排队的包没有被发送;

  • 硬件问题(路由器接口、线缆、CSU/DSU);

  • 时钟信令不一致

  • 环路接口

  • 接口关闭

  • 线协议down且接口定期重启

  • show controllers serial 0 ;显示接口状态、是否连有线缆、时钟速率

  • show buffers ;查看系统buffer池,接口buffer设置

  • debug serial interface ;显示HDLC或Frame Relay通信信息

    2、CSU/DSU环路测试

    有四种类型的环路测试:

    在本地CSU/DSU上测试本地环路;在远端CSU/DSU上测试本地环路;从本地NIU到远端CSU/DSU测试远端环路;从远端NIU到本地CSU/DSU测试远端环路;用PPP封装的串行链路上,PPP用协商Magic Number检测环回网络。

    3、串行线中总结

    1) 症状和问题:

    Interface is administratively down;line protocol is down:

    1) 接口被从命令行关闭

    2) 不允许重复的IP地址,两个使用相同IP地址的接口将down

    Interface is down;line protocol is down:

    1) 不合格的线缆2) 没有本地提供商的信令3) 硬件故障(接口或CSU/DSU、线缆)4) 时钟

    Interface is up;line protocol is down:

    1) 未配置的接口:本地或远程2) 本地提供商问题3) Keepalive序号没有增加4) 硬件故障(本地或远端接口、CSU/DSU)5) 线路杂音6) 时钟不一致7) 第2层(如LMI)

    Interface is up;line protocol is up(looped) 链路在某处环路 Incrementing carrier transition counter

    1) 来自本地提供商的信号不稳定2) 线缆故障3) 硬件故障

    Incrementing interface resets

    1) 线缆故障,导致CD信号丢失2) 硬件故障3) 线路拥塞

    Input drops,errors,CRC,and framing errors

    1) 线路速率超过接口能力2) 本地提供商问题3) 线路杂音4) 线缆故障5) 不合格线缆6) 硬件故障

    Output drops:接口传输能力超过线路速率

    2) 问题和行动

    本地提供商问题:

    1) 检查CSU/DSU的CD信号和其它信号,看链路是否在发送和接收信息

    2) 如果没有CD信号或有其它问题,联系本地提供商处理故障

    不合格或故障的线缆:

    1) 使用符合设备要求的线缆2) 使用breakout盒检查3) 交换故障线缆

    未配置的接口:

    1) 使用show running-config校验接口配置

    2) 确认链路两端使用相同的封装类型

    Keepalive问题:

    1) 验证keepalive被发送2) 配置了keepalive发送,debug keepalive3) 验证序号在增加4) 如果序号不增加,运行环路测试5) CSU/DSU环路,序号仍不增,则硬件故障

    硬件故障:

    1)更换硬件

    接口在环路模式:

    1) 检查接口配置2) 如果在接口配置有环路,移除3) 如果接口配置被清除,清除CSU/DSU环路模式4) 如CSU/DSU不在环路模式,可能是提供商置环

    接口administratively down:

    1) 检查是否有重复的IP地址

    2) 进行接口配置模式,执行no shutdown

    线路速率大于接口能力:

    1) 使用hold-queue减少进入的队列尺寸

    2) 增加输出的队列尺寸

    接口速率大于线路速率:

    1) 减少广播流量2) 增加输出的队列3) 如有需要,使用队列算法

    二、处理帧中继故障

    DLCI用于在帧中继中标识虚拟链路,DLCI仅仅是本地信令,DLCI与第3层IP地址相映射。

    处理帧中继的步骤:

    1) 检查物理层,线缆或接口问题;2) 检查接口封装;3) 检查LMI类型;4) 校验DLCI到IP的映射;5) 校验Frame Delay的PVC;6) 校验Frame Delay的LMI;7) 校验Frame Delay映射;8) 校验环路测试;

    1、帧中继的show命令

    show interface

    show frame-relay lmi ;显示LMI相关信息(LMI类型、更新、状态)show frame-relay pvc ;输出PVC信息、每条DLCI的LMI状态、…)show frame-relay map ;提供DLCI号信息和所有FR接口的封装

    2、帧中继的debug命令

    debug frame-relay lmi ;显示LMI交换信息

    debug frame-relay events ;显示协议和应用程序使用DLCI的细节

    3、帧中继总纳

    1) 症状和问题

    Frame Realy link is down:

    1) 线缆故障2) 硬件故障3) 本地服务商问题4) LMI类型不一致5) Keepalive没有被发送6) 封装类型不一致7) DLCI不一致

    从Frame Delay网络不能ping远端主机

    1) DLCI指定了错误的接口2) 封装类型不一致3) ACL问题4) 接口配置错误

    线缆故障:

    1) 检查线缆并测试接头

    2) 更换线缆

    硬件故障:

    1) 执行环路测试,以分离硬件

    2) 将线缆连接到路由器的另一同样配置的接口,如OK,则需更换硬件

    本地服务提供商问题:

    1) 如环路测试使LMI状态up,但不能连接远端着站点,联系本地载波

    2) 包含载波问题,就好象FR配置错误,如DLCI不一致或封装不一致。

    LMI类型不一致:

    1) 校验路由器的LMI类型与PVC上的每个设备都一致

    2) 如使用公共提供商网络,不能访问LMI,与提供商联系

    Keepalive问题:

    1)使用show interface查看是否keepalive被禁用,或校验keepalive被正常配置

    2)如果keepalive设置错误,进入配置模式并在接口上指定keepalive间隔

    封装类型:

    1) 校验两端路由器的封装方式相同,如有非Cisco路由器,必须用IETF。用show frame-relay命令显示封装信息

    2)用encapsulation frame-relay ietf更换封装方式,与可用frame-relay map设置某个PVC的封装。

    DLCI不一致:

    1) 用show running-config和show frame-relay pvc显示指派给某接口的DLCI号

    2) 如DLCI号配置正常,联系供应商校验FR交换机是否了相同的DLCI

    ACL问题:

    1) 使用show ip interface显示应用到接口上的ACL

    2) 分析ACL,如有需要,删除或修改它

    第三章•处理ISDN故障

    一、ISDN基本原理

    二、常见ISDN故障

    ISDN问题分成3类:配置不当的路由器、物理线缆和ISDN协议、配置不当的交换机。

    1、配置不当的路由器

    配置不当由于不同原因:typographical错误、从服务供应商提供的错误信息、本路由器配置不正确

    1) SPID(Service Profile Identifiers):如SPID和LDN配置错误,将有ISDN连接问题。SPID仅用于北美,只有服务供应商要求时才设置。2) CHAP:CHAP认证在使用PPP封装的接口上使用。两端路由器的CHAP配置一定要相同。在PPP中,用户名和口令是大小写敏感的。3) Dialer Map实体:Dialer map关联高层地址到相关的电话号码。每种协议需要一条dialer map语句。4) 访问列表:ACL可用于ISDN连接以阻止某类型流量触发连接。

    2、物理层连接

    1) BRI:在现有电话线上提供数字服务。2) ISDN BRI信道:2B D(2*64 16 48=192kbps);ISDN BRI的物理帧为48bits,链路每秒发送4000帧。3) 本地环路:客户和CO之间的链路,连接ISDN设备到ISDN交换机。4) 物理层:参考点(R、S、T、U);设备(LT/ET、NT1、NT2、TE1、TE2、TA)

    三、配置不当的电话交换机

    在新安装ISDN时,必须考虑服务供应商ISDN交换机配置错误的可能性。

    1、第2层故障处理:

    ISDN第2层故障处理的目标:q.921协议和PPP。

    1) q.921:ISDN的第2层在q.921中定义。Q.921信令在D信道上用LAPD协议传输。

    处理q.921故障最常用命令是debug isdn q921,问题常与TEI(terminal endpoint identifier)、SAPI(service access point identifier)和SABME(set asynchronous balanced mode extended)有关。

    TEI=127表示广播;TEI=64-126保留用于动态分配。

    SAPI=0表示当前第3层信令;63表示用于TEI值分配的管理SAPI;64为呼叫控制。

    2) PPP:PPP使用LCP设置和维护链路;NCP配置和维护网络层协议。

    2、第3层故障处理:

    ISDN第3层也叫q.931,使用debug isdn q931命令可查看call setup、connect、release、cancel、status、disconnect和、user information。

    ISDN第3层连接在本地路由器(TE)和远端ISDN交换机(ET)之间。

    ISDN呼叫建立的过程:

    1) SETUP:在本地TE和远端ET之间发送信息2) CALL_PROC:呼叫处理信令3) ALERT:4) CONNECT5) CONNECT_ACK

    3、交换机类型:

    配置ISDN时,必须用isdn switch-type命令指定本地环路的交换机。

    四、ISDN故障处理命令

    1、ping:在DDR中,ping命令触发一个呼叫,在第2个B信道up前,路由器已完成了ping。2、clear interface bri n:重置接口上不同的计数器并中止接口上的连接。3、show interface bri n:显示关于ISDN BRI D信道的信息4、show interface bri n 1 2:显示ISDN BRI的B信道信息。5、show controller bri:显示接口硬件控制器信息和U接口,供Cisco的TAC处理故障。6、show isdn status:显示ISDN接口状态和各层详细信息。7、show dialer:显示关于DDR连接的信息,包括拨号、成功的连接、IDLE时间、呼叫数。8、show ppp multilink:

    五、调试ISDN

    1、debug bri:提供有关BRI B信道的信息,包括带宽信息2、debug isdn q921:获取关于接口D信道的信息,D信息用于在交换机和本地ISDN设备间传输信令。3、debug dialer:呼叫连接的原因和连接的状态。4、debug isdn q931:监视发生在第3层的事件。Cause ID显示呼叫被拒绝的原因;CallRef ID发送和返回的信息,用于分析路由器和交换机之间不同呼叫的特定会话。5、debug ppp negotiation:提供建立PPP会话的实时信息,可察看CHAP和PAP验证6、debug ppp packet:报告实时PPP包流,包括包的类型和所用的B信道

    来源:鸿鹄论坛

  • 免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

      分享
      投诉
      首页