首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
深度学习
梧桐秋下雨
创建于2025-10-24
订阅专栏
基于(动手学深度学习 pytorch版),动手理解原理
暂无订阅
共3篇文章
创建于2025-10-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
多头注意力详解(通俗易懂版)
废话不多说直接上代码再来讲解 注意看注释,关键代码来看到forward 我们先来讲输入吧,(batch_size, num_kvpairs, num_hiddens)按照(2,4,10,num_hea
缩放点击注意力推导
点击缩放注意力推导 点击缩放评分公式为:a(q,k) / d ** -1 这里提出一个问题,为什么要除以根号d,以及这个d表示的什么 现在我们来推导一个这个a(q,k)的方差 假设满足以下条件 假设Q
如何更好地理解位置编码的本质,零基础入门版
如何更好地理解位置编码的本质 这里有一个重要的概念 div_term 衰减因子,更加适合新手入门的学习,用很简单具体的案例来演示位置编码到底是拿来干什么的