AI - 码龙_的收藏集 - 掘金

AI

更多收藏集

6篇文章 · 0订阅

大模型量化技术原理-LLM.int8()、GPTQ

近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。模

吃果冻不吐果冻皮
2年前
5.6k
6
评论

Qwen2大模型微调入门实战（完整代码）

Qwen2是通义千问团队的开源大语言模型，由阿里云通义实验室研发。以Qwen2作为基座大模型，通过指令微调的方式实现高准确率的文本分类，是学习大语言模型微调的入门任务。指令微调是一种通过在由（指令，

林泽毅
1年前
4.0k
26
2

Qwen2大模型微调入门实战（完整代码）

学大模型必看！手把手带你从零微调大模型！

今天分享一篇技术文章，你可能听说过很多大模型的知识，但却从未亲自使用或微调过大模型。今天这篇文章，就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务，因此本篇文章仅从

董章鱼是个攻城狮
1年前
3.6k
30
6

一种在本地部署Qwen通义千问大模型的超简单方法-兼容OpenAi接口

有很多开源大模型都可以本地部署，用于替代 chatGPT 实现本地执行各种任务，比如国内较好的通义千问Qwen1.5 全尺寸模型。在一般的翻译、文案创作、辅助编码等任务上，基本达到了ChatGPT3

mortimer
2年前
11k
11
4

一种在本地部署Qwen通义千问大模型的超简单方法-兼容OpenAi接口

Llama-3.2-3B-Instruct PyTorch模型微调最佳实践

1 引言 Meta Llama 3.2多语言大型语言模型集合（LM）是一个1B和3B大小（文本输入/文本输出）的预训练和指令微调模型集合。Llama 3.2指令调整的纯文本模型针对多语言对话用例进行了

魔乐社区
1年前
1.5k
4
评论

魔搭社区：解锁LLM大模型的无限可能｜豆包MarsCode AI刷题

什么是大模型？大型语言模型（LLM）是指那些拥有数十亿甚至上百亿参数的语言模型。这些模型通过深度学习算法，利用海量文本数据进行训练，能够理解和生成人类语言。LLM的核心优势在于其广泛的知识基础和强大

不是鱼
1年前
1.5k
51
18