翻译

翻译合辑，存放我翻译的各位大佬的文章。

等 7 人订阅共13篇文章创建于2022-09-24

【翻译】MoE图解指南

原作信息 A Visual Guide to Mixture of Experts (MoE) 在看最新发布的大型语言模型（LLMs）时，你可能经常会在标题中看到 “MoE” 这个词。那么，这个 “M

9月前
596
12
2

【翻译】LLM智能体图解指南

LLM智能体图解指南 —— 探索单智能体与多智能体的核心组成部分大语言模型智能体（LLM Agents）现在越来越常见，似乎已经逐渐取代了我们熟悉的“普通”对话式大模型。这些强大的能力并不是轻而易举

9月前
1.0k
10
2

【翻译】图解deepseek-R1

AI大模型蓬勃发展，各个厂家百花齐放。在AI持续发展的历程中，deepseek是一个重要的节点。对机器学习研发圈来说，它的意义重大，原因包括：开源权重，还有更小型、精简的版本，分享并展示了如何复现

9月前
317
1
评论

【翻译】图解deepseek-R1

【翻译】图解Stable Diffusion

原文信息翻译自作者V2 Nov 2022版本。原文：The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine l

3年前
2.2k
23
11

【翻译】图解Stable Diffusion

【翻译】图解GPT-3原理

前排提示主要是意译+我的补充，想看原文表达的拖到最底下有链接。原文翻译在科技界我们可以看到很多关于GPT-3的新闻。大型语言模型（比如GPT-3）已经展示出让我们惊讶的性能。虽然对于大部分企业来

3年前
3.8k
27
6

Pytorch中如何使用扩散模型？机器学习扩散模型简介

本文正在参加「金石计划 . 瓜分6万现金大奖」扩散模型是一种生成模型，在过去的几年里忽然火了起来，这其中也是有一定原因的。单看2020前后的几篇开创性的文章我们就可以知道扩散模型的性能了。

3年前
2.4k
24
28

Pytorch中如何使用扩散模型？机器学习扩散模型简介

【翻译】最近兴起的扩散模型

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第22天，点击查看活动详情本文翻译自：The recent rise of diffusion-based models

3年前
3.9k
28
25

【翻译】图解GPT-2

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第3天，点击查看活动详情这是我翻译这位大佬的第二篇文章了。这篇文章是受到大佬认证的了。他的原文中有翻译链接，直接指向我。

3年前
3.3k
14
25

【翻译】图解自注意力机制

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第12天，点击查看活动详情这是我翻译这位大佬的第二篇文章了。这篇文章是受到大佬认证的了。他的原文中有翻译链接，直接指向我。

3年前
2.6k
28
23

【翻译】图解BERT、ELMo等 | NLP迁移学习开端

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第18天，[点击查看活动详情]

3年前
2.2k
10
8

【翻译】图解BERT、ELMo等 | NLP迁移学习开端

【翻译】图解transformer

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第1天，点击查看活动详情写在最前边看transformer相关文章的时候发现很多人用了相同的图。直到我搜到原作……于是去申请翻

3年前
3.4k
20
11

【翻译】图解transformer

Transformer的位置编码详解

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第8天，点击查看活动详情使用正弦函数为模型添加位置信息 Transformer是只基于自注意力机制的序列到序列架构。因为并行计算能

3年前
2.5k
7
评论

初学者想问：人工神经网络中要使用多少隐藏层、多少隐藏单元？

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第9天，点击查看活动详情对于这个问题我之前查阅了各种文章写了个精简的综合版，可以看这里：神经网络中如何确定隐藏层的层数和大小，本文

3年前
1.8k
4
评论