transformer - 用户8659294703886的收藏集 - 掘金

transformer

用户8659294703886

更多收藏集

5篇文章 · 0订阅

信我！这里有普通人也能理解的 Transformer

你一定听说过当下风靡全球的 ChatGPT，但你知道它是如何利用 Transformer 模型的神奇力量吗？这里将用最通俗易懂的方式，揭秘 Transformer 的来龙去脉，结构原理。

常先森
2年前
2.6k
8
评论

信我！这里有普通人也能理解的 Transformer

从头理解与编码LLM的自注意力机制

本文将介绍Transformer架构和GPT-4、LLaMA等语言大模型中使用的自注意力机制。自注意力和相关机制是LLM的核心组件，使用LLM时，了解这些机制十分有必要。

OneFlow一流科技
2年前
2.5k
1
评论

图解Transformer系列二：Self-Attention（自注意力机制）

作为最近热门的生成式大模型的基石，Transformer自2017年诞生以来，就成为nlp研究者必须掌握的基本模型。本系列将通过图解方式，全方面展示Transformer的细节。

猛猿
2年前
6.4k
5
7

图解Transformer系列二：Self-Attention（自注意力机制）

Attention isn’t all you need！Mamba混合大模型开源：三倍Transformer吞吐量

自 2017 年开创性研究论文《Attention is All You Need》问世以来，transformer 架构就一直主导着生成式人工智能领域。

机器之心
2年前
960
1
评论

Attention isn’t all you need！Mamba混合大模型开源：三倍Transformer吞吐量

从零详细解读什么是Transformer模型

Transformer由论文《Attention is All You Need》提出，在本文中，我们将试图把模型简化一点，并逐一介绍里面的核心概念，希望让普通读者也能轻易理解。

安可可可可
2年前
3.1k
9
8

从零详细解读什么是Transformer模型