大模型原理 - 稀有猿诉的收藏集 - 掘金

大模型原理

关于大语言模型的原理，如Encoding, Decoding和Tranformer。

更多收藏集

3篇文章 · 0订阅

计算机是如何理解文字的？

之前写过一篇介绍词向量的文章：5分钟搞懂什么是词嵌入，里面说到：通过把文本转换为词向量，就可以十分方便的计算两者之间的关系，看看哪两个单词更为相近。比如有四个单词：“猫”、“狗”、“鱼”、“跑”，通

董董灿是个攻城狮
1年前
532
2
1

图解 Transformer [译]

原文：The Random Transformer 作者：Jay Alammar 讨论环节：在 Hacker News 上获得 65 分，共有 4 条评论在 Reddit 的 r/MachineL

宝玉的工程技术分享
1年前
2.4k
26
12

深入理解Transformer技术原理｜得物技术

谷歌在2017年发布Transformer架构的论文时，论文的标题是：Attention Is All You Need。重点说明了这个架构是基于注意力机制的。

得物技术
1年前
6.8k
56
2

深入理解Transformer技术原理｜得物技术