服务器常见故障

一.有关服务器无法启动的主要原因 :
   ①市电或电源线故障(断电或接触不良)
   ②电源或电源模组故障
   ③内存故障(一般伴有报警声)例如:(长声不断。内存没有插好或者损坏了)
内存有故障时,机器是无法在显示器上显示出任何的画面
   ④CPU故障(一般也会有报警声:通常在开机启动时出现5声短声,可以判断出CPU有故障,同时在你开机的时候 只卡在机器品牌logo等)。
   ⑤主板故障 (开机长鸣报警无法启动,多次擦拭内存金手指能用1、2小时然后自动重启,多次重启后就继续长鸣报警无法开机)
⑥其它插卡造成中断冲突

二.服务器无法启动处理
1)检查电源线和各种I/O接线是否连接正常。
 2)检查连接电源线后主板是否加电。
 3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。
 4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。
 5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板)

三、系统频繁重启 
原因:
①电源故障(替换法判断解决)
   ②内存故障(可从BIOS错误报告中查出)
   ③网络端口数据流量过大(工作压力过大)
   ④软件故障(更新或重装操作系统解决)

四、服务器死机故障判断处理:
1、第一方面-软件故障
   ①首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。
   ②电脑病毒的原因。
   ③系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。(厂家技术)
   ④软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决
2、第二方面-硬件故障
①硬件冲突
   ②电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。
   ③硬盘故障(通过扫描硬盘表面来检查是否有坏道)
   ④内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)
   ⑤主板故障(使用替换法来判断)
   ⑥CPU故障(使用替换法)
   ⑦板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)

五、安装操作系统时提示找不到硬盘
故障原因:
   无物理硬盘设备
   硬盘线缆连接问题
   没有安装硬盘控制器驱动或驱动不相符

六、RAID卡相关常见故障
 第一类: RAID卡本身有问题
   ①经常表现为RAID信息丢失,硬盘经常掉线,不能做REBUILD,开机自检时检测不到硬盘或时间长。
第二类: 硬盘本身问题
   ①表现为硬盘掉线,在RAID阵列中的状态为DEAD,或者在作REBUILD时,作到某一进度就不能继续
 
七.常见网卡故障 
1、检查网卡LED灯状态
网卡状态指示灯说明 
左边的为链路指示灯,右边的为网络活动指示灯: 
 链路指示灯为绿色稳定代表10Mbps,橙色稳定代表100Mbps,黄色稳定代表
1000Mbps,特例Intel 82562ET 10/100网卡,绿色代表100Mbps,不亮代表10Mbps   网络活动指示灯:不亮代表网络空闲,闪烁代表网卡有数据通信
2、如果驱动正常,检查网络协议和服务是否正常,可与其他机器做比较。ping 127.0.0.1,ping自己和其他主机IP。
3.检查网线是否有信号。如果网线正常,进入BIOS查看是否读取到网卡。
4.利用外接的pci网卡来测试 ,如果可以使用,再把线接回原来网卡看是否正常工作,如是不能。就可以排查出物理网卡存在问题。

由睿江云运维人员提供,想了解更多,请登陆www.eflycloud.com
赞 (0) 评论 分享 ()