网络故障排查方法典型经验
类型:桌面终端
关键字:网络故障,排查办法
1、引言
作为网管,经常会接到各种故障报修电话,其实总结一下,这些电话的主要内容不外乎两点,一类是计算机问题,一类是网络问题。所以,公司网管要做的,也是主要从这两个方面入手,一方面要掌握计算机硬件结构、软件运维方法以应对计算机问题,另一方面要学会网络故障排除方法应对网络问题。
其实网络问题也有很多种,工作中常见的主要有三种,一种是因计算机用户误操作引发的故障,第二种是因线路破坏引发的故障,第三种是设备自身原因造成的故障。
为了能更好更快地判断网络故障究竟出现在哪一个环节,我们面对网络问题时,必须有一个清晰地思路,也要有一个行之有效的排查方法,这样才能临危不乱,泰然处之。
2、现象描述
模拟场景一:
网管接到电话,报修人描述本机无法登录网页,右下角网络连接状态的提示图标不显示,电脑上的网口指示灯正常,办公室内其它计算机上网正常。
模拟场景二:
报修人描述本部门办公室内所有计算机均无法访问网页,电脑显示网络连接正常,但没有收包。
模拟场景三:
网络管理员发现局域网内主机间访问突然变慢,网络处于时断时续状态。 3、处理过程
对于场景一、二,以及相似的根据报修人的描述来判断网络故障的情况,在最终确定网络故障点之前,要学会引导报修人提供有用信息,从而帮助网络管理员在亲临现场之前就对故障原因有大体的认识和判断,有时候甚至只根据报修人提供的线索,就能判断故障原因,并提供有效的解决方案。这样可以节省大量的人力物力,也节约了在奔往现场的时间,在这个一寸光阴一寸金的时代,有效地引导、学会吸取有用信息显得格外重要。
根据报修人提供的信息,对故障有了大体了解,进而就可以采取相应的措施了。
对于由计算机造成的网络连接障碍,现场排查步骤如下:
1、查看用户机器的 TCP/IP 配置,查看用户的 IP 地址、子网 掩码、 DNS server 地址、 网关等是否正确,若配置有问题,可相应修改。比如,主机配置的 IP 地址与其他主机冲突,或 IP 地址根本不在子网范围内,这都会导致该主机不能连通。
2、验证网卡及 TCP/IP 协议栈是否有问题。可用 Ping 127.0.0.1(Localhost)和 Ping x.x.x.x (Self address)地址来 确认本机 TCP/IP 设置。
2.3.3 若 TCP/IP 配置没有问题,首先可考虑是否是交换机的端口出现故障,通过将客户机器切换到正常工作的交换机的端口上,并测试其结果,若仍然不通,可排除交换 机的端口故障的可能性;若将客户机器切换到正常工作的交换机的端口后,通讯正常,则原端口可能出现故障,此时就检查端口的速率、双工方式、VLAN 的设置,若是设置问题,可通过 Set port speed 10/100 ,Set port duplex half/full1,Set port vlan 等命令做相应更改。
3、当排除用户端和交换机端口问题后,通讯仍然不正常,则问题可定位在用户网卡和网线上,最直观的方法就看主机网卡或交换机端口指示灯是否亮,若不亮肯定是网线或网卡有问题,此时可通过替换法来确认问题并解决问题。
对于场景三,也是网络管理员较常应对的状况之一,面对整个局域网的问题,网络管理员必须有一个清晰的分析思路,同时,也要学会运用各种网络管理工具,辅助分析,为我们的判断结果提供依据。
下面是一些常用的网络分析工具,有些是计算机本身具有的功能,有些是网管专有工具。 Ping命令的运用:
Ping 127.0.0.1 测试换回地址的连通性。Ping本机ip地址测试网卡性能。
若无法等到结果,可以按照下列步骤检查:a、该计算机是否正确安装了网卡;b、该计算机是否正确地安装了tcp/ip协议;c、该计算机是否正确地配置了ip地址和子网掩码。
Ping局域网内其它ip地址。Ping网关ip。
若上面的ping后得到正确回应,则说明本机网卡无损坏,从而需要确定是本机所处局域网中哪一环出现了问题。若ping局域网内其它计算机通,但ping网关不通,则是局域网交换机到网关的问题;若ping局域网内其它计算机不通,则可能是本机到局域网交换机之间线路或者接口的问题。
Ping远程ip。若ping局域网内ip通,但ping远程ip不通,则说明是网关或者网关与远程网络之间的问题。
Ping某一域名。若ping远程ip通,但ping域名不通,则有可能是域名解析地址错误或者域名服务器出现问题。
Ipconfig命令的运用:
Ipconfig /all是比较常用的命令,可以通过该命令查看本机的ip地址和mac地址,以及一些网络信息,尤其是在本机ip地址是通过dhcp服务器分配时,无法直接看出ip地址,则可以通过此命令找到自动分配的ip地址。
Ethereal软件:
Ethereal (Ethereal:A Network Packet Sniffing Tool)是当前较为流行的一种计算机网络调试和数据包嗅探软件。Ethereal 基本类似于tcpdump,但Ethereal 还具有设计完美的 GUI 和众多分类信息及过滤选项。用户通过 Ethereal,同时将网卡插入混合模式,可以查看到网络中发送的所有通信流量。它具有用户对协议分析器所期望的所有标准特征,并具有其它同类产品所不具备的有关特征。最简单的应用就是在局域网内抓包,对抓到的包进行过滤,从而分析网络故障的原因。
4、原因分析
网络故障出现的原因主要有四点,分别对应tcp/ip协议的四个层次:物理层负责介质的连接,因此故障主要出现在连接线路上以及接口处,可能是外力作用造成的线路断裂,也可能是线路与接口接触不良等;数据链路层主要负责数据的最后一层封装,这一层的故障主要出现在交换机上,常常是交换机端口未开启,或者交换机软件造成的封装问题,不太常见;网络层出现的问题较多,一般重点关注ip地址和子网掩码的配置是否有问题,路由协议配置是否正确,在信息传递路径上排查问题时可以沿着源到目的地的路径查看路由表,同时检查接口的ip地址配置;最高层是应用层,这一层出现的故障问题常常在于浏览器的配置,或者计算机本身软件或者硬件问题。小型局域网中,路由器和交换机较少,网络层问题较少见,其网络故障主要可能出现在四个方面:用户机器的问题,包括软件和硬件两个方面,网络连接线的问题和交换机的问题。
5、经验总结
网络故障产生的原因多种多样,但排查的思路都是一样的。作为网管,一定要在面对问题时一定要冷静分析,用对方法。根据计算机呈现出的不同现象,找到相应的症结,方可对症下药。其实,作为网管都会有这样的体会,分析的过程很头痛,解决的方法很简单。网络的复杂便在于它的变化性,可能同一个故障原因却有不同的表现形式,抑或是不同的故障却有相同的解决方法,但不管怎样,查找故障的思路都是大同小异的,而如何对症下药,则需要网管有过硬的专业素养,因此方法与知识积累并重。
网络故障排查方法典型经验
类型:桌面终端
关键字:网络故障,排查办法
1、引言
作为网管,经常会接到各种故障报修电话,其实总结一下,这些电话的主要内容不外乎两点,一类是计算机问题,一类是网络问题。所以,公司网管要做的,也是主要从这两个方面入手,一方面要掌握计算机硬件结构、软件运维方法以应对计算机问题,另一方面要学会网络故障排除方法应对网络问题。
其实网络问题也有很多种,工作中常见的主要有三种,一种是因计算机用户误操作引发的故障,第二种是因线路破坏引发的故障,第三种是设备自身原因造成的故障。
为了能更好更快地判断网络故障究竟出现在哪一个环节,我们面对网络问题时,必须有一个清晰地思路,也要有一个行之有效的排查方法,这样才能临危不乱,泰然处之。
2、现象描述
模拟场景一:
网管接到电话,报修人描述本机无法登录网页,右下角网络连接状态的提示图标不显示,电脑上的网口指示灯正常,办公室内其它计算机上网正常。
模拟场景二:
报修人描述本部门办公室内所有计算机均无法访问网页,电脑显示网络连接正常,但没有收包。
模拟场景三:
网络管理员发现局域网内主机间访问突然变慢,网络处于时断时续状态。 3、处理过程
对于场景一、二,以及相似的根据报修人的描述来判断网络故障的情况,在最终确定网络故障点之前,要学会引导报修人提供有用信息,从而帮助网络管理员在亲临现场之前就对故障原因有大体的认识和判断,有时候甚至只根据报修人提供的线索,就能判断故障原因,并提供有效的解决方案。这样可以节省大量的人力物力,也节约了在奔往现场的时间,在这个一寸光阴一寸金的时代,有效地引导、学会吸取有用信息显得格外重要。
根据报修人提供的信息,对故障有了大体了解,进而就可以采取相应的措施了。
对于由计算机造成的网络连接障碍,现场排查步骤如下:
1、查看用户机器的 TCP/IP 配置,查看用户的 IP 地址、子网 掩码、 DNS server 地址、 网关等是否正确,若配置有问题,可相应修改。比如,主机配置的 IP 地址与其他主机冲突,或 IP 地址根本不在子网范围内,这都会导致该主机不能连通。
2、验证网卡及 TCP/IP 协议栈是否有问题。可用 Ping 127.0.0.1(Localhost)和 Ping x.x.x.x (Self address)地址来 确认本机 TCP/IP 设置。
2.3.3 若 TCP/IP 配置没有问题,首先可考虑是否是交换机的端口出现故障,通过将客户机器切换到正常工作的交换机的端口上,并测试其结果,若仍然不通,可排除交换 机的端口故障的可能性;若将客户机器切换到正常工作的交换机的端口后,通讯正常,则原端口可能出现故障,此时就检查端口的速率、双工方式、VLAN 的设置,若是设置问题,可通过 Set port speed 10/100 ,Set port duplex half/full1,Set port vlan 等命令做相应更改。
3、当排除用户端和交换机端口问题后,通讯仍然不正常,则问题可定位在用户网卡和网线上,最直观的方法就看主机网卡或交换机端口指示灯是否亮,若不亮肯定是网线或网卡有问题,此时可通过替换法来确认问题并解决问题。
对于场景三,也是网络管理员较常应对的状况之一,面对整个局域网的问题,网络管理员必须有一个清晰的分析思路,同时,也要学会运用各种网络管理工具,辅助分析,为我们的判断结果提供依据。
下面是一些常用的网络分析工具,有些是计算机本身具有的功能,有些是网管专有工具。 Ping命令的运用:
Ping 127.0.0.1 测试换回地址的连通性。Ping本机ip地址测试网卡性能。
若无法等到结果,可以按照下列步骤检查:a、该计算机是否正确安装了网卡;b、该计算机是否正确地安装了tcp/ip协议;c、该计算机是否正确地配置了ip地址和子网掩码。
Ping局域网内其它ip地址。Ping网关ip。
若上面的ping后得到正确回应,则说明本机网卡无损坏,从而需要确定是本机所处局域网中哪一环出现了问题。若ping局域网内其它计算机通,但ping网关不通,则是局域网交换机到网关的问题;若ping局域网内其它计算机不通,则可能是本机到局域网交换机之间线路或者接口的问题。
Ping远程ip。若ping局域网内ip通,但ping远程ip不通,则说明是网关或者网关与远程网络之间的问题。
Ping某一域名。若ping远程ip通,但ping域名不通,则有可能是域名解析地址错误或者域名服务器出现问题。
Ipconfig命令的运用:
Ipconfig /all是比较常用的命令,可以通过该命令查看本机的ip地址和mac地址,以及一些网络信息,尤其是在本机ip地址是通过dhcp服务器分配时,无法直接看出ip地址,则可以通过此命令找到自动分配的ip地址。
Ethereal软件:
Ethereal (Ethereal:A Network Packet Sniffing Tool)是当前较为流行的一种计算机网络调试和数据包嗅探软件。Ethereal 基本类似于tcpdump,但Ethereal 还具有设计完美的 GUI 和众多分类信息及过滤选项。用户通过 Ethereal,同时将网卡插入混合模式,可以查看到网络中发送的所有通信流量。它具有用户对协议分析器所期望的所有标准特征,并具有其它同类产品所不具备的有关特征。最简单的应用就是在局域网内抓包,对抓到的包进行过滤,从而分析网络故障的原因。
4、原因分析
网络故障出现的原因主要有四点,分别对应tcp/ip协议的四个层次:物理层负责介质的连接,因此故障主要出现在连接线路上以及接口处,可能是外力作用造成的线路断裂,也可能是线路与接口接触不良等;数据链路层主要负责数据的最后一层封装,这一层的故障主要出现在交换机上,常常是交换机端口未开启,或者交换机软件造成的封装问题,不太常见;网络层出现的问题较多,一般重点关注ip地址和子网掩码的配置是否有问题,路由协议配置是否正确,在信息传递路径上排查问题时可以沿着源到目的地的路径查看路由表,同时检查接口的ip地址配置;最高层是应用层,这一层出现的故障问题常常在于浏览器的配置,或者计算机本身软件或者硬件问题。小型局域网中,路由器和交换机较少,网络层问题较少见,其网络故障主要可能出现在四个方面:用户机器的问题,包括软件和硬件两个方面,网络连接线的问题和交换机的问题。
5、经验总结
网络故障产生的原因多种多样,但排查的思路都是一样的。作为网管,一定要在面对问题时一定要冷静分析,用对方法。根据计算机呈现出的不同现象,找到相应的症结,方可对症下药。其实,作为网管都会有这样的体会,分析的过程很头痛,解决的方法很简单。网络的复杂便在于它的变化性,可能同一个故障原因却有不同的表现形式,抑或是不同的故障却有相同的解决方法,但不管怎样,查找故障的思路都是大同小异的,而如何对症下药,则需要网管有过硬的专业素养,因此方法与知识积累并重。