问:我租的云服务器频繁死机,到底什么原因?
我租的服务器最近经常死机,需要重启后就没事了,但过一段时间又会出现这个情况,请问怎么解决?
答:因为死机如果排除硬件问题的话,绝大多是业务层、或者软件层的原因,这个就需要用户自己找部署业务的技术人员协助排查,作为服务器出租方是,没办法帮您做得太细的,就算阿里云、腾讯云也没有这方面的支持,需要您去第三方市场找第三方技术人员付费排查解决。
简单的道理:机房就像厂房的房东一样,您是租客,如果您租了间厂房,您的生产线设备经常出问题,或者造成电闸跳闸短路等,找房东没法帮您解决的,您得找设备的技术人员帮您分析评估。
云服务器死机的问题排查方向
硬环境问题原因
如果您租的是香港云服务器和VPS,死机也叫宕机,就基本可排除硬件问题了,因为宿主机里运行了大量的云服务器,如果是硬件问题,那就是死一大片了,所以机房、运营商会实时监控底层硬环境问题。一般都是排除硬环境问题,大多是单用户方面软环境的原因。
业务环节问题原因
1.例如您的服务器用于web访问,并发量巨大,造成内存、CPU、或者硬盘IO过高,导致死机,服务终止。
2.被同行攻击,同行对您的网站发动CC攻击,造成CPU,内存异常过高死机;
3.被同行DDOS流量攻击,直接瘫痪您的网络;
软环境问题原因
1.网站程序、软件程序代码不规范,造成服务器死循环执行软件,造成死机;
2.病毒感染:一般表现,起初能够正常运行,某天突然运行速度变慢,工作效率急剧下降,例如CPU,内存,带宽占用异常偏高,出现频繁的死机。例如一些发包攻击木马,挖矿病毒等;
3.低配置运行高负载的业务,在内存、、CPU较小的情况下,运行占用内存较大的应用业务或者程序。
4.软件有冲突或不兼容:安装某一软件前系统工作正常,当安装后系统不正常了,那么问题肯定是该软件造成的。不同软件在运行时有时会有冲突和不不兼容的地方,或者防病毒软件有小 BUG。
6.软件配置不当,例如一些杀毒、防火墙设置不当,自动备份任务,脚本任务配置不当,导致内存,cpu过高,或者硬盘塞满等原因造成系统异常。
7.异常操作损坏,例如您的服务器正在执行一些关键任务,例如备份打包,移动一些核心数据或程序,中途被您强行终止,有几率损坏环境造成死机。
8.香港云服务器运载软件和环境过多,过量占用服务器资源导致资源耗尽而出现死机。
云服务器宕机排查小结
软件环境问题造成死机的,如果不熟悉服务器的用户,一般建议找您服务器的部署的技术人员帮您排查原因,从软件程序、业务环境、日志、病毒木马多方面考虑。如果非业务原因造成的,例如攻击、负载方面,实在找不出原因,建议重装系统环境来重新部署提高排错成功率。