首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
梧桐秋下雨
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
多头注意力详解(通俗易懂版)
废话不多说直接上代码再来讲解 注意看注释,关键代码来看到forward 我们先来讲输入吧,(batch_size, num_kvpairs, num_hiddens)按照(2,4,10,num_hea
缩放点击注意力推导
点击缩放注意力推导 点击缩放评分公式为:a(q,k) / d ** -1 这里提出一个问题,为什么要除以根号d,以及这个d表示的什么 现在我们来推导一个这个a(q,k)的方差 假设满足以下条件 假设Q
如何更好地理解位置编码的本质,零基础入门版
如何更好地理解位置编码的本质 这里有一个重要的概念 div_term 衰减因子,更加适合新手入门的学习,用很简单具体的案例来演示位置编码到底是拿来干什么的
初级背包问题,层层剖析为什么这样做。最好需要自己推演一遍。
初级背包问题,层层剖析为什么这样做。这里举了三个例子,一个01背包的例子,还有一个完全背包的例子,还有一个逆思维的例子。
个人成就
文章被点赞
1
文章被阅读
364
掘力值
59
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2025-06-30