LLMs - Liberalism的收藏集 - 掘金

LLMs

Liberalism 创作等级LV.3

更多收藏集

3篇文章 · 0订阅

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型（LLM）实现与训练优化上的创新工作。

阿里云大数据AI技术
1年前
1.4k
5
1

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

众所周知，LLM 规模庞大，如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。我们之前撰写的 LLM.int8 博文展示了我们是如何将 LLM.int8 论文中的技术通过 bitsand

HuggingFace
1年前
1.1k
13
评论

重新思考终端 LLMs 和 Agents

LLM 和 Agent 如火如荼，有哪些用途？当此之时，终端将何往？如何发挥终端优长？笔者给出了自己的预判和建议。

字节跳动_离青
1年前
6.6k
44
10