AI 创业指难 (二) :在云服务器上面部署 AIGC 记录

4,981 阅读6分钟

👈👈👈 欢迎点赞收藏关注哟

首先分享之前的所有文章 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164…
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca…

一. 前言

后续计划是自己训练一个模型出来,资源有限个人电脑跑的话几晚上都跑不出来,所以考虑搞一台云服务去跑,相对会快一点。

云服务器上的部署流程

  • S1 : 购买云服务,GPU 服务器会很贵,如果是短期使用或者学习用,走按量付费会便宜很多
  • S2 : 选择服务的镜像 (WindowsServer) , 一般这里不选网上提供的镜像,可能会出现很多问题
  • S3 : 安装显卡驱动,一般情况下创建的公共镜像是没有安装驱动的
  • S4 : 安装一键部署脚本 ,我这里用的是 绘世 的脚本
  • S5 : 开始炼丹

关于价格

对于云服务 ,有几套方案 ,之前也有人总结过 @ zhuanlan.zhihu.com/p/621216632

  • 阿里云 / 腾讯云 / 华为云 : 包月型的服务器适合职业玩家,而哪怕抢占式的服务器,对于普通玩家而言价格都不低。 要形成生产力的服务器,一般都超过 20/小时。 关键是要自己部署
  • 揽睿星舟 / AutoDL / 智星云等等 : 这些都是乘着AI风爆发的小厂,相对而言会为了这个领域做了很多专门的设计(比如有专门的镜像),但是缺点就是限制很多,不太稳定
  • 个人建议 :小厂活动还是很多的,能薅羊毛就先薅羊毛,如果对技术有把握,自己去部署也不是不行。
    • 这一篇就是专门针对 Windows 系统部署的相关教程

二. 服务器的选购

2.1 划重点 : GPU 的选择

❗ ❗ ❗ 不是说越贵的服务器就越好,可以无脑上,不同 GPU 对于不同领域的效果是不一样的。

这一篇主要讲的 AIGC ,那么就以 AIGC 距离,参考国外的一篇文章的结论 :

@ blog.salad.com/stable-diff…

经济成本比较图 :

image.png

  • sec/img : 每张图片需要花费的时间 (秒)
  • cost/hr : 每小时的费用
  • 柱状图 : 经济成本,越长则经济成本越低

总结 : 从性能上来看 ,虽然 3090 和 A100 , A5000 的性能最高,平均只需要3秒,但是他们的成本完全不一样。 这3个里面, 3090 得出得结论是最经济的。

但是从更宏观的角度来说 ,反而3060更经济,他一美元可以生成 5000 多张图。

所以 ,从选购上来考虑的时候,要考虑时间和经济双重成本。

图像效果比较图 :

image.png

可以看到从效率上看 ,A5000 最强,但是每一美元生成的图像并不多。只能说时间最快,但是也贵。

综合下来, 选择消费级的 GPU 会更理想。

2.2 采购方式 :大厂/小厂 ? 消费级/企业级?

大厂企业级 GPU 的选择 :

image.png

image.png

  • 选购建议 :
    • 阿里云 / 腾讯云 等几个云厂商都有对应的服务器
    • 一些专门提供 GPU 服务器的云厂商也可以进行选购,但是可控性会低一点
    • 根据自己的需求选配置 ,开始验证功能的时候不用选择太好的配置
    • 云盘一定要大于 60G ,不然安装软件就不够用了
    • 带宽可以考虑用固定的,按流量有点贵而且不稳定

小厂购买消费级 GPU :

小厂并不是说企业很小 , 而是和阿里腾讯这些云服务商相比,更专注于某个领域的公司。

image.png

单纯从价格上来说,真没什么好计较的,和阿里云比太便宜了。 但是问题也在于限制可能会比较多。

2.3 最终总结

  • 阿里云等大厂会提供更稳定的硬件环境,但是价格更贵,基本上是企业级显卡
  • 阿里云的软件自由度会更高,可以安装自己想要的版本自由组合
  • 其他的专业型供应商,价格会更便宜,但是大部分环境已经锁死,自由度低

专业厂商大部分不需要安装部署,所以下面针对的是阿里云的玩法 或者类似需要自行部署的。

三. 安装部署

3.1 驱动的安装

以 N 卡驱动为例 ,一般有2种安装方式 :

image.png

以上我的驱动就安装完了,打开服务器就能看到N卡的控制面板了!

3.2 部署安装

  • 部署的方式: 👉👉👉
  • 基于整合的集成软件Windows),多数是 UP 主整合的一键部署包 ,比如绘世
    • PS : 可能有的人不喜欢这种,认为里面会有肉鸡等 ,可以考虑另外的方式
    • 我这里也就简单使用,所以选择使用这种
  • 基于 Linux 去部署更原始的版本 (还在尝试,这一篇不叙述)

资料来源网站

这里建议使用阿里云盘下载,我是直接在云服务器上面下载了阿里云盘,然后下载一系列东西的。

S1 : 连接远程桌面后下载阿里云盘

  • 本地 运行 内输入 MSTSC 打开远程桌面连接器 (Administrator)
  • 通过 阿里云盘 下载客户端

image.png

S2 : 安装后运行

image.png

3.3 直接使用第三方环境

例如在 Featurize 中,可以直接选择对应的环境,启动后按照流程处理就可以使用 :

image.png

当然 ,这种情况下就需要自己下载模型放进去了 :Featurize 中需要打开工作区去 :

上传数据集后下载即可 @ docs.featurize.cn/docs/manual…

// 方式一 : 数据集
- S1 : 先上传数据集
- S2 : 下载后可以在 /home/featurize/data 中看到


// 方式二 : 在界面的下沿也可以找到上传的按钮 (会慢的多)

image.png

四. 注意事项

  • 正式使用的时候 ,显存要求很高,显存不够会直接导致程序退出
  • 如果线程实在不够 ,可以选择低显存模式,同时别忘了修改处理的 GPU

image.png

PS : 如果不选择高性能的云服务器,就没必要用云,还不如本地电脑

总结

记录一下这两天干的事情,后面应该会用的上

其中最花时间的其实是下载部署工具,其他的步骤其实花不了多少时间。

如果长期使用,可以考虑挂载 OSS ,内网流量会快很多。

  • 之前我还尝试过 CentOS 安装 ,使用 Docker 也是可以安装成功,但是过程上会很复杂
  • 主要原因在于拉取 Docker 镜像速度不可控,拉取的效果也不好,可能出现乱七八糟的问题
  • 总的来说还是 Windows 系统亲切点

完结!下个周末开始正式炼丹了。