首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
翻译
Ann_
创建于2022-09-24
订阅专栏
翻译合辑,存放我翻译的各位大佬的文章。
等 7 人订阅
共13篇文章
创建于2022-09-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
【翻译】MoE图解指南
原作信息 A Visual Guide to Mixture of Experts (MoE) 在看最新发布的大型语言模型(LLMs)时,你可能经常会在标题中看到 “MoE” 这个词。那么,这个 “M
【翻译】LLM智能体图解指南
LLM智能体图解指南 —— 探索单智能体与多智能体的核心组成部分 大语言模型智能体(LLM Agents)现在越来越常见,似乎已经逐渐取代了我们熟悉的“普通”对话式大模型。这些强大的能力并不是轻而易举
【翻译】图解deepseek-R1
AI大模型蓬勃发展,各个厂家百花齐放。在AI持续发展的历程中,deepseek是一个重要的节点。对机器学习研发圈来说,它的意义重大,原因包括: 开源权重,还有更小型、精简的版本, 分享并展示了如何复现
【翻译】图解Stable Diffusion
原文信息 翻译自作者V2 Nov 2022版本。 原文:The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine l
【翻译】图解GPT-3原理
前排提示 主要是意译+我的补充,想看原文表达的拖到最底下有链接。 原文翻译 在科技界我们可以看到很多关于GPT-3的新闻。大型语言模型(比如GPT-3)已经展示出让我们惊讶的性能。虽然对于大部分企业来
Pytorch中如何使用扩散模型? 机器学习扩散模型简介
本文正在参加「金石计划 . 瓜分6万现金大奖」 扩散模型是一种生成模型,在过去的几年里忽然火了起来,这其中也是有一定原因的。 单看2020前后的几篇开创性的文章我们就可以知道扩散模型的性能了。
【翻译】最近兴起的扩散模型
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第22天,点击查看活动详情 本文翻译自:The recent rise of diffusion-based models
【翻译】图解GPT-2
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第3天,点击查看活动详情 这是我翻译这位大佬的第二篇文章了。这篇文章是受到大佬认证的了。他的原文中有翻译链接,直接指向我。
【翻译】图解自注意力机制
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第12天,点击查看活动详情 这是我翻译这位大佬的第二篇文章了。这篇文章是受到大佬认证的了。他的原文中有翻译链接,直接指向我。
【翻译】图解BERT、ELMo等 | NLP迁移学习开端
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第18天,[点击查看活动详情]
【翻译】图解transformer
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第1天,点击查看活动详情 写在最前边 看transformer相关文章的时候发现很多人用了相同的图。直到我搜到原作……于是去申请翻
Transformer的位置编码详解
持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第8天,点击查看活动详情 使用正弦函数为模型添加位置信息 Transformer是只基于自注意力机制的序列到序列架构。因为并行计算能
初学者想问:人工神经网络中要使用多少隐藏层、多少隐藏单元?
持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第9天,点击查看活动详情 对于这个问题我之前查阅了各种文章写了个精简的综合版,可以看这里:神经网络中如何确定隐藏层的层数和大小,本文