滚滚滚 - 用户61001614228的收藏集 - 掘金

滚滚滚

用户61001614228

更多收藏集

1篇文章 · 0订阅

大模型低显存推理优化-Offload技术

由于 GPU 资源稀缺和昂贵，一定程度上使得大模型的应用和普及变得困难。因此，本文从大模型推理部署出发，介绍了一些低硬件成本（消费级GPU、CPU等）部署大模型的方法，并着重介绍了低显存推理优化技术O

吃果冻不吐果冻皮
1年前
4.6k
17
1