背景
家里目前服役的设备是一个16年买的HP gen8家用小服务器,中间陆续升级到了16g内存和E3-1265L V2 cpu,算是性能和功耗散热的最佳平衡配置了,安装了esxi系统,虚拟化了一个centos系统,分配了6核心、12g内存,主力使用跑一些我需要的服务。还有一个Windows 10分配了2核4g,主要方便远程桌面到家里内网,有个随时能访问的Windows还是非常方便的。不过2核4g的win10,那叫一个捉襟见肘,软件基本告别多开了,网页多开几个内存占用都要百分之七八十了。centos也没好到哪去,虽然分了大部分内存,gitlab,Jenkins,docker几个吃内存大户一上,随随便便就到八十多了,再跑点东西内存分分钟报警。就萌生了换套设备的想法,不过需要家庭预算,又本着又不是不能用的原则,凑合一下就行了,一直就这么着吧。
缘起
7月某日晚饭后手贱无事点开了某海鲜市场,突然眼前一亮,amd epyc 7282cpu + 华硕服务器主板只要2200还赠送一个散热器。epyc之前了解过,那性能和功耗还是可以的。赶紧去查一下资料,7282 霄龙处理器2代,功耗120w 频率2.8,睿频3.2,16核32线程。性能和功耗非常符合我的预期,更高的cpu性能适用场景也暂时没有,倒是功耗必须要考虑,毕竟是要7*24小时运行的,120w的cpu低负债下整机应该能做到一天2-3度电的。主板 华硕KRPA-U16服务器主板,拓展接口那是相当丰富,要是要让我插满的话估计要破产了,缺点就是EEB主板有点大,需要配个大机箱了。心里估算了一下机箱电源花个一千多,整个32g拆机内存估计几百块,数据无价硬盘搞个三星980pro一千块,四千多多搞定,这个预算还是能申请的。
开搞
沟通老板,表示东西他测试过都正常,如果有问题可以退回来的,一查老板清一色好评,下单。开始准备配件,机箱看了追风者614和银欣星斗Seta Q1,最后选了稍小和静音更好的银欣,价格贵了三百,不符合垃圾佬气质。内存高频的ECC REG内存没有16g的,基本都是无货,只能选32g的,对比2933MHz和3200Mhz,选了2933,尽显垃圾佬气质(后期还是后悔没上3200,后面又加配置了,为了沉默成本只能还选2933的)。电源当时海韵、振华都没有折扣,最后选了一个追风者的850w金牌全模组电源,海韵代工应该也还行。硬盘三星980pro 1tb,拉满,这里不要垃圾佬气质了。坐等收货!
装机
焦急等待两天后,所有东西终于全部到齐,晚上到点立马下班回家。简单吃个饭开始装机,媳妇还贴心给打灯,完美,由于提前下载看了主板说明书,也装过电脑多次,硬件安装不是问题,顺利拼装完成。插网线连接IMPI口(远程控制服务器),使用默认密码,密码错误!完犊子,问老板,老板表示自己也不知道,让自己主板重置一下。关键主板vga口,临时到上海媳妇这里暂住,这里哪有vga口显示器,也没有hdmi接口的显卡。出现意外,不过老婆说小区群里热心邻居很多,还有很多程序员,要不群里问问。一问还真有热心邻居有个备用750显卡闲着,顺利解决。轻车熟路先装个win10,顺利完成。稍稍安心。
意外
开始测试,cpu-z看一下有没有问题,AIDA64烤机试一下,参数和烤机半小时都正常,心里觉得稳了,进系统的时候点了一下系统更新这个时候也完成了,提示要不要重启,那必须的。照例等待转圈圈,重启接着转圈圈,咦,这圈圈这么不转了,硬盘灯也不闪了,心想坏事,只能强制重启,提示意外重启,回退更新重新进入系统。问题出在哪,难道我下周的镜像有问题,检查本地文件和网站md5值,文件一样,换个u盘重新装系统。这次更糟安装系统输入用户名时候卡死,重启还能继续安装,系统安装成功。太晚了今天搞不完了只能先AIDA64长时间压测一下,明天再搞。分析可能出问题的点:cpu,内存,主板,硬盘,系统。直觉上cpu和内存可能性应该比较小,没办法只能排除法测试了。
第二天下班,发现将近20来个小时的烤机依然正常,只能先测试排除硬盘了,最后拆个硬盘,问题依然存在。镜像是用过很多次的,这个也能排除。不过过程中发现插着网线,安装系统过程中必卡死,不插正常,但是之后更新系统还是会卡死失败。那就只能cpu、内存、主板了,这两个没法替换也是一起的,只能再测内存了。下单了一个全新同型号内存,比二手价格快翻一倍了,开启走向深渊的第一步了。
内存到货测试,问题依然在。虽然不想,但此时结果只能指向主板和cpu了。老板爽快同意退货。
再战
这搞了一半也不能停下来呀,媳妇看我不停的折腾,也觉得折腾二手太浪费时间了,直接上全新吧。有了预算,这几天的折腾也受够了,那就再选cpu,主板和散热器,原来送的散热器也的确吵,系统安装和更新卡死,第一感觉也是主板问题,主板也就是选全新的了,最后综合评估选了超微H12SSL-i。cpu这玩意基本不会坏,还是海鲜市场选了个epyc 7282。散热器选了利民TR——TA120EX TR4,还看了猫头鹰的一款(太贵了),算了,已经步入深渊了不能再往里走了。
漫长等待,收货装机,一切驾轻就熟。
安装测试,炸裂!!!系统更新依然会卡死,不应该呀。因为换主板了又重新下载了新的主板说明书,内存这块上面写着内存建议至少4条,插在C、D、G、H槽,难道是内存不够的原因,要装了肯定要装完,那就一步到位再买2条。彻底走向罪恶深渊,忘记了初心,只是想捡个垃圾而已。
等待内存,接着做个长时间的压力测试,看看系统稳定性。测试六十多个小时cpu和内存全部满载依然没有任何问题,这个期间也给主板的商家沟通了,那边的技术人员表示这种情况他们没有遇到过,看着像软件问题,店家说觉得是主板问题可以发回来他们测试一下。
内存到货重新测试,问题依在,这个时候把重心放到了软件方面,系统! 安装centos,Ubuntu,esxi都正常,Ubuntu系统更新安装也正常。经过更长时间的压测也都完全正常。个人感觉也不是硬件问题,因为东西都换成了全新。基本都有三年左右的质保,后期真有问题也影响不大,至此整个服务器装机只有cpu和三根内存是二手的了。cpu成了整体大件中最便宜的了,1000块,真是为了一碟醋包了一顿饺子。
装机完成
问题可能原因:后面测试中我发现设备中,有一列有感叹号的设备(没有驱动的设备):pcie加密/解密设备。手动搜索安装驱动,安装完成,提示重启,之后必卡死不能进系统,至于为什么出现这个应该是这两个主板都有TPM插槽,但是没有配TPM芯片,Windows系统中,安装最新win10系统也是正常,只有在大版本升级,比如之前的镜像1909版本,安装完成之后提示可以升级201H版本,这个时候就会出问题,如果直接安装最新的21H2版本,小更新也不会有问题。后续可以买个TPM芯片插上再测试一下(大概率不会试了,用不到)
总结
一通折腾结果啥钱都没省到,由最初的四千多,来到了现在的将近一万块(媳妇知道了又该被说了)。不过也算收货了心仪的服务器主机,为了方便直通当主机使用加了一个amd R7 240亮机卡,整机待机70w左右。不出问题的话未来5年应该就是它替代gen8服役了,配置充足,可以任性折腾了。还有个小遗憾就是装机的时候基本没拍照片,现在想记录一下没图(主机也放回杭州家中,不在身边),凑合啦。
整机方案:
型号规格 | |
---|---|
CPU | amd epyc 7282 |
内存 | 三星 DDR4 ECC REG 32G *4 |
主板 | 超微H12SSL-i |
硬盘 | 三星 980 Pro 1tb |
电源 | 追风者 AMP 850金牌全模组 |
机箱 | 银欣 星斗Seta Q1 |
玩法
主要用途规划
-
家庭服务器
跑一下各种开发环境docker、gitlab、Jenkins、k8s、各种数据库等需要的服务
以及娱乐使用的媒体服务中心,博客,网盘,游戏服务器,以及智能家居等
还有其他有用和好玩的服务,随时添加
-
存储
搭个nas服务器,对现有服役的两盘位群晖做个补充