数码之家

 找回密码
 立即注册
搜索
查看: 12771|回复: 48

[软件] 今天被恶心了,WIN服务器每隔70多分钟死机,找不到原因

[复制链接]
发表于 2021-9-19 16:48:33 | 显示全部楼层 |阅读模式
一台2017年的Dell-R630服务器,硬件6核cpu,32G内存,4个1.8T的硬盘组的阵列,win server2008 r2系统
除了第一次是隔了2小时多外,其它都是每隔70几分钟死的,我还开了温度监测,几乎没有负载,温度始终48度左右跳,cpu负载也基本都在0附近,连死机的画面冻结在那里(死机时不是蓝屏而是画面冻结)时我看到的任务管理器里cpu都是0%,内存一直8%左右,没有变动
开了几个软件
3proxy(好像昨天我就改了这个一点点参数,它工作正常,我有点怀疑这个,现在把它关了在等1个多小时)
一个postgre数据库服务
一个ftp

即使把网线断开,也是同样准时死机,没有任何预兆,死机前一切正常,然后画面直接冻结
查看系统事件日志,也没发现和以前有什么多出来的变化(里面的一般异常都是以前每次都有的)

每次死机时看硬盘灯,全绿,正常(我还hdtune慢扫了一遍系统盘,正常),其它灯也是全绿,看不到异常的灯


开机清了下灰,还是一样,没变,73分钟后冻结在死机画面,每次都是瞬间冻结,找不到原因

拜求各位大佬,有没有见过类似的,帮忙指教啊,求救:unhappy:

@ljlun

发表于 2021-9-19 16:52:18 | 显示全部楼层
先把怀疑有问题的软件停用或卸载,操作系统不要用软件激活,有些会留后门或有奇怪问题。
回复 支持 反对

使用道具 举报

发表于 2021-9-19 17:02:04 | 显示全部楼层
没有买维保么?公司用的服务器一般都买了保修,出问题直接找厂商便是
回复 支持 反对

使用道具 举报

发表于 2021-9-19 17:17:52 | 显示全部楼层
换个 2019 系统的操作系统吧,
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-19 17:25:46 | 显示全部楼层
ccxshua 发表于 2021-9-19 17:17
换个 2019 系统的操作系统吧,

换系统简单,但机上的还有厂商安装的数据库
=============================
又死机了,正好又是74分钟,太准确了,简直就和定时好了一样
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-19 17:27:15 | 显示全部楼层
听雨亭 发表于 2021-9-19 16:52
先把怀疑有问题的软件停用或卸载,操作系统不要用软件激活,有些会留后门或有奇怪问题。 ...

正在做的就是这种排除法。唉。每次都要74分钟左右后死机(没有蓝屏,就是画面冻结),简直和定时好一样
回复 支持 反对

使用道具 举报

发表于 2021-9-19 17:58:36 | 显示全部楼层
杀毒
杀毒
杀毒
说不定结果会是惊喜
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:04:39 | 显示全部楼层
3proxy,查这个
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:19:18 | 显示全部楼层
本帖最后由 岳母三千 于 2021-9-19 18:21 编辑

我遇到过定屏,最后查到是显卡问题,你可以换张亮机卡测试下。
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:20:57 | 显示全部楼层
先重新安装一个系统试试,确定不是系统的事
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-19 18:31:03 | 显示全部楼层

刚才关了,还是一样的74分钟
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:37:59 | 显示全部楼层
看idrac日志,有没有异常,主要检查一下是CPU死机还是软件死机
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:41:34 | 显示全部楼层
重启以后把所有非系统必须服务都关闭,然后看会不会再死机,如果还是,那么是系统问题,不管硬件还是软件,如果不死机,那么再一个一个服务再打开待机去验证
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-19 18:43:17 | 显示全部楼层
upkon 发表于 2021-9-19 18:37
看idrac日志,有没有异常,主要检查一下是CPU死机还是软件死机

这台机器idrac没有连上过,连不上,很可能以前就是这样的。虽然也设了IP,但ping不到。另一台R420倒是可以连上。
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:43:27 | 显示全部楼层
如果每次死机是定时的,大概率还是某个软件设置上的问题可能大些
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:44:03 | 显示全部楼层
可能是电源模块出问题了,尤其是电容部分失效了,这个可能会出现定时死机。以前在台式机电源上发生过类似的问题,不过没玩过这种服务器机型。
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:45:33 | 显示全部楼层
先重装系统,排除软件的原因,如果还是出现的话就要考虑硬件问题了
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-19 18:46:06 | 显示全部楼层
岳母三千 发表于 2021-9-19 18:19
我遇到过定屏,最后查到是显卡问题,你可以换张亮机卡测试下。

你那次也是固定70几分钟定屏吗,我这不只是定屏,关机键没反应,ping也直接没反应
回复 支持 反对

使用道具 举报

发表于 2021-9-19 18:58:48 | 显示全部楼层
要保存数据只能先把4个1.8T的硬盘组的阵列断开,找个备用硬盘装下新系统试下,看会不会又准点死机,会就是硬件问题,不会就是软件设置问题,软件问题,你就再把4个阵列硬盘挂上排除软件问题,这样不会伤数据又科排除软硬件问题,就是比较折腾
回复 支持 反对

使用道具 举报

发表于 2021-9-19 19:56:30 | 显示全部楼层
jtcat 发表于 2021-9-19 18:46
你那次也是固定70几分钟定屏吗,我这不只是定屏,关机键没反应,ping也直接没反应 ...

发现时两个小时左右也没找到原因,之后定屏时间越来越短只有15分钟完全没法用,换显卡就正常了。
建议你用硬件排除一下更快。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2024-4-26 00:50 , Processed in 0.171601 second(s), 12 queries , Redis On.

Powered by Discuz!

© 2006-2023 smzj.net

快速回复 返回顶部 返回列表