👈👈👈 欢迎点赞收藏关注哟
首先分享之前的所有文章 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164…
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca…
一. 前言
后续计划是自己训练一个模型出来,资源有限个人电脑跑的话几晚上都跑不出来,所以考虑搞一台云服务去跑,相对会快一点。
云服务器上的部署流程
- S1 : 购买云服务,GPU 服务器会很贵,如果是短期使用或者学习用,走按量付费会便宜很多
- S2 : 选择服务的镜像 (
WindowsServer
) , 一般这里不选网上提供的镜像,可能会出现很多问题 - S3 : 安装显卡驱动,一般情况下创建的公共镜像是没有安装驱动的
- S4 : 安装一键部署脚本 ,我这里用的是 绘世 的脚本
- S5 : 开始炼丹
关于价格
对于云服务 ,有几套方案 ,之前也有人总结过 @ zhuanlan.zhihu.com/p/621216632
- 阿里云 / 腾讯云 / 华为云 : 包月型的服务器适合职业玩家,而哪怕抢占式的服务器,对于普通玩家而言
价格都不低
。 要形成生产力的服务器,一般都超过 20/小时。关键是要自己部署
。 - 揽睿星舟 / AutoDL / 智星云等等 : 这些都是
乘着AI风爆发的小厂
,相对而言会为了这个领域做了很多专门的设计
(比如有专门的镜像),但是缺点就是限制很多,不太稳定
。 - 个人建议 :小厂活动还是很多的,能薅羊毛就先薅羊毛,如果对技术有把握,自己去部署也不是不行。
- 这一篇就是专门针对 Windows 系统部署的相关教程
二. 服务器的选购
2.1 划重点 : GPU 的选择
❗ ❗ ❗ 不是说越贵的服务器就越好,可以无脑上,不同 GPU 对于不同领域的效果是不一样的。
这一篇主要讲的 AIGC ,那么就以 AIGC 距离,参考国外的一篇文章的结论 :
经济成本比较图 :
sec/img
: 每张图片需要花费的时间 (秒)cost/hr
: 每小时的费用柱状图
: 经济成本,越长则经济成本越低
总结 : 从性能上来看 ,虽然 3090 和 A100 , A5000 的性能最高,平均只需要3秒,但是他们的成本完全不一样
。 这3个里面, 3090 得出得结论是最经济的。
但是从更宏观的角度来说 ,反而3060更经济,他一美元可以生成 5000 多张图。
所以 ,从选购上来考虑的时候,要考虑时间和经济
双重成本。
图像效果比较图 :
可以看到从效率上看 ,A5000 最强,但是每一美元生成的图像并不多。只能说时间最快,但是也贵。
综合下来, 选择消费级的 GPU 会更理想。
2.2 采购方式 :大厂/小厂 ? 消费级/企业级?
大厂企业级 GPU 的选择 :
- 选购建议 :
- 阿里云 / 腾讯云 等几个云厂商都有对应的服务器
- 一些专门提供 GPU 服务器的云厂商也可以进行选购,但是可控性会低一点
- 根据自己的需求选配置 ,开始验证功能的时候不用选择太好的配置
- 云盘一定要大于 60G ,不然安装软件就不够用了
- 带宽可以考虑用固定的,按流量有点贵而且不稳定
小厂购买消费级 GPU :
小厂并不是说企业很小 , 而是和阿里腾讯这些云服务商相比,更专注于某个领域的公司。
单纯从价格上来说,真没什么好计较的,和阿里云比太便宜了。 但是问题也在于限制可能会比较多。
2.3 最终总结
- 阿里云等大厂会提供更稳定的硬件环境,但是
价格更贵
,基本上是企业级显卡
。 - 阿里云的
软件自由度会更高
,可以安装自己想要的版本
,自由组合
- 其他的专业型供应商,价格会更便宜,但是
大部分环境已经锁死,自由度低
。
专业厂商大部分不需要安装部署,所以下面针对的是阿里云的玩法
或者类似需要自行部署的。
三. 安装部署
3.1 驱动的安装
以 N 卡驱动为例 ,一般有2种安装方式 :
- 有的厂商是直接提供脚本安装的 , 例如下面这种(
其他云厂商得自己找一找
) - 如果找不到厂商得驱动 ,则可以去官方下载驱动
以上我的驱动就安装完了,打开服务器就能看到N卡的控制面板了!
3.2 部署安装
- 部署的方式: 👉👉👉
- 基于
整合的集成软件
(Windows
),多数是 UP 主整合的一键部署包
,比如绘世- PS : 可能有的人不喜欢这种,认为里面会有肉鸡等 ,可以考虑另外的方式
- 我这里也就简单使用,所以选择使用这种
- 基于 Linux 去部署更
原始的版本
(还在尝试,这一篇不叙述)
资料来源网站
这里建议使用阿里云盘下载,我是直接在云服务器上面下载了阿里云盘,然后下载一系列东西的。
- 阿里云分享(
感谢大佬
) : www.aliyundrive.com/s/9M1unmFMJ… - 原版目录 (
Bilibili
) : 下载地址
S1 : 连接远程桌面后下载阿里云盘
- 本地
运行
内输入MSTSC
打开远程桌面连接器 (Administrator) - 通过 阿里云盘 下载客户端
S2 : 安装后运行
3.3 直接使用第三方环境
例如在 Featurize 中,可以直接选择对应的环境,启动后按照流程处理就可以使用 :
当然 ,这种情况下就需要自己下载模型放进去了 :Featurize 中需要打开工作区去 :
上传数据集后下载即可 @ docs.featurize.cn/docs/manual…
// 方式一 : 数据集
- S1 : 先上传数据集
- S2 : 下载后可以在 /home/featurize/data 中看到
// 方式二 : 在界面的下沿也可以找到上传的按钮 (会慢的多)
四. 注意事项
- 正式使用的时候 ,显存要求很高,显存不够会直接导致程序退出
- 如果线程实在不够 ,可以选择低显存模式,同时别忘了修改处理的 GPU
PS : 如果不选择高性能的云服务器,就没必要用云,还不如本地电脑
总结
记录一下这两天干的事情,后面应该会用的上
其中最花时间的其实是下载部署工具,其他的步骤其实花不了多少时间。
如果长期使用,可以考虑挂载 OSS ,内网流量会快很多。
- 之前我还尝试过 CentOS 安装 ,使用 Docker 也是可以安装成功,但是过程上会很复杂
- 主要原因在于拉取 Docker 镜像速度不可控,拉取的效果也不好,可能出现乱七八糟的问题
- 总的来说还是 Windows 系统亲切点
完结!下个周末开始正式炼丹了。