1、真死机:服务器确实宕机了,机器登陆不上,ping 不通,需要让机房重启
2、假死机:由于硬件资源暂时性地被消耗殆尽,因而无法对外部指令进行响应的现象。
比如cpu 内存 带宽跑满,可观察监控,再宕机前的资源消耗情况,等待一会,看能否恢复,此时机器比较卡顿,能ping 通,尝试登陆,再能登陆的时候,可能需要kill或者重启进程。实在不行,只能让机房强制重启。
1、查看系统日志 /var/log/messages,分析宕机时间前后的系统日志,看看是否有明显的报错,比如oom或内核bug;
2、查看监控,在宕机前有没有指标异常,比如CPU或内存突增,可能短暂突发上量超过系统承载能力;
3、硬件故障,可以看下/var/log/dmesg,或者登录远控查看系统日志,比如内存故障等,可能需要更换;