要记录一下,以免以后阿尔茨海默。

不瞒各位,最近 TopomelBox
开发进度接近停止,源于我一直在折腾我的老爷机(联想-天逸510)。这老伙计跟了我三年多,兢兢业业,也还算皮实。但是最近一个月,经常动不动就蓝屏错误:WHEA_UNCORRECTABLE_ERROR。

本来想着如果有个崩溃转储也还行,可以用WinDbg研究研究。但是发现,转储直接生成失败。看起来,有点和内存和硬盘有点关系了(?)。
也就是说,操作系统应该是在某一个特殊的时间点,遭受了一个致命伤害,甚至都没有机会将崩溃信息写入到转储文件中就…。这可难坏宝宝了。

接下来,我去到了一个我平常最爱逛的地方:事件日志。我认为每一个码龙都应该有此爱好?
我发现有一个特点,蓝屏出现前会发生一堆WHEA-Logger 17错误,类似于下图(图片来自网络,不是实机):

从具体的错误文本来看,是PCIe上的一个设备出现了一个硬件错误。

我试了下面一些方法,不大可行,但还是列举出来,以飨读者。

1)
将BIOS的C-State关闭。这台联想的机器,BIOS里没有网络上所说的C-State,但是有一些和电脑性能的开关,比如睡眠级别C1,电源管理C1E,超频等。
我就极端了一点,将所有这些所谓的节能开关全部关闭,确保电脑始终以高性能模式运行。在系统的电源选项里,也关闭了节能模式,切换到了高性能。

此方法没有消除WHEA-Logger 17错误,也没能改善系统蓝屏的问题。看起来,我运气不大好。

2) 禁用PCI Express Root Port
通过打开设备管理器的隐藏设备,尝试将WHEA-Logger指向的设备禁用,然后重启。

此方法解决不了问题,纯属我自己瞎搞。

3) Win11降级到Win10
之前是一直跑的Win11版本,上面的各种花式软件也装了不少,会不会是系统里垃圾软件太多了?
于是网上做了一个Win10的启动盘,装了一个不算很纯净版本的Win10。

此方法无法解决问题,应该和系统这个层面没有多大关系。

看到曙光了,但不是每一件事都有一个好结局

对于一个伪完美主义者来说,我实在不希望在做某件事情的时候,直接蓝屏且没有任何分析方法。是的,蓝屏可以,人无完人,机无完机,但是我需要一些可以研究其原因的方法。
实在被折磨得没有办法,我找出祖传工具箱,拆开了那机箱。
像个装机老手一样,我装模作样地,将内存条用橡皮擦重新擦拭了一遍,仪式感直接拉满。
然后将不需要的SATA硬盘线给拆了,反正是SSD且以后没有需要加硬盘了,还将不需要的金属支撑框架也给拆了。是的,拆!

又想着,机器上的蓝牙和WIFI有没有可能是故障点?然后在BIOS里将他们两兄弟也直接禁用。

小心翼翼地满怀希望地再次开机。

这一次我没有一股脑的装各种软件,而是一天装它2~3个,然后测试事件日志和蓝屏的情况。

好消息是,事件日志里,没有再出现WHEA-Logger 17错误了,难道我这次”挠到痒痒了”?

继续进行患者术后观察,特意在高负载的工况下运行了几天,没有再出现蓝屏的画面。禁不住一声长叹:”翻译翻译,什么,叫惊喜?”

总结

首先就是,我好像也不太能确定,上面哪项修改解决了此问题。总不能是我把了条SATA线就解决了吧?(如果真是这样,我要说这世界它确实太魔幻)

各位猿友切不可生搬硬套。

然后就是,生命无常,我知道,我的老爷机终将消失在风里,我也一样。
我能做的,就是好好地陪伴它,用我的余生好好撸码。

技术
下载桌面版
GitHub
Gitee
SourceForge
百度网盘(提取码:draw)
云服务器优惠
华为云优惠券
腾讯云优惠券
阿里云优惠券
Vultr优惠券
站点信息
问题反馈
邮箱:[email protected]
吐槽一下
QQ群:766591547
关注微信