首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
月来客栈
掘友等级
公众号:月来客栈 www.ylkz.life
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 5
沸点 1
赞
6
返回
|
搜索文章
月来客栈
关注了
渀波儿灞
月来客栈
3年前
关注
This post is all you need(层层剥开Transformer)
各位朋友大家好,欢迎来到月来客栈。今天要和大家介绍的一篇论文是谷歌2017年所发表的一篇论文,名字叫做”Attention is all you need“[1]。 以下为...
赞
评论
分享
月来客栈
3年前
举报
给你这几个样本点,怎么求得超平面?
mp.weixin.qq.com
收起
查看大图
向左旋转
向右旋转
分享
评论
点赞
月来客栈
3年前
举报
对于Transformer 中Q,K,V的来历,还有不清楚的么?
收起
查看大图
向左旋转
向右旋转
分享
评论
点赞
月来客栈
3年前
举报
基于Transformer翻译模型数据预处理流程
收起
查看大图
向左旋转
向右旋转
分享
评论
点赞
月来客栈
3年前
举报
带你从0到1实现Transformer
收起
查看大图
向左旋转
向右旋转
分享
评论
点赞
月来客栈
3年前
举报
Transformer中的解码过程到底如何进行?
收起
查看大图
向左旋转
向右旋转
赞过
分享
评论
1
月来客栈
3年前
举报
需要endnote的朋友抓紧了,手慢无~
mp.weixin.qq.com
分享
评论
点赞
月来客栈
3年前
关注
This post is all you need(①多头注意力机制原理)
1 引言 各位朋友大家好,欢迎来到月来客栈。今天要和大家介绍的一篇论文是谷歌2017年所发表的一篇论文,名字叫做”Attention is all you need“[1]...
2
评论
分享
月来客栈
3年前
举报
还看不懂self-attention?
收起
查看大图
向左旋转
向右旋转
赞过
分享
2
1
月来客栈
3年前
举报
RNN和LSTM中batchsize和timestep的区别是什么?
RNN和LSTM中batchsize和timestep的区别是什么?(知乎回答)
mp.weixin.qq.com
分享
评论
点赞
月来客栈
3年前
举报
元芳,你怎么看?
收起
查看大图
向左旋转
向右旋转
赞过
分享
评论
1
月来客栈
3年前
关注
多标签分类中的损失函数与评价指标
1 引言 各位朋友大家好,欢迎来到月来客栈。在前面的一篇文章[1]中笔者介绍了在单标签分类问题中模型损失的度量方法,即交叉熵损失函数。同时也介绍了多分类任务中常见的评价指标...
1
评论
分享
月来客栈
4年前
关注
模型的改善与泛化(梯度与等高线)
在上一篇文章中,笔者介绍了什么是等高线,并且还同时直接给出了梯度的垂直于等高线的结论,但是并没有介绍为什么。因此本篇文章就来大致介绍一下梯度为什么会垂直于等高线。 设为平面...
赞
评论
分享
月来客栈
4年前
关注
逻辑回归(混淆矩阵与评估指标)
上一篇文章中笔者对于什么是逻辑回归,以及它能用来干什么做了一个详细的介绍;同时,对于如何通过开源库进行建模训练并预测也给出了详细的示例,并对训练得到的决策边界进行了可视化。...
赞
评论
分享
月来客栈
4年前
关注
逻辑回归(模型的建立与求解)
在上一讲中,笔者通过五篇文章来详细的介绍了线性回归模型,那么本讲开始继续介绍下一个经典的机器学习算法逻辑回归(Logistics Regression)。 如图所示为逻辑回...
赞
评论
分享
月来客栈
4年前
关注
线性回归(目标函数的推导)
经过前面多篇文章的介绍,我们知道了什么是线性回归、怎么转换求解问题、如何通过sklearn进行建模并求解以及梯度下降法的原理与推导。同时,在上一篇文章中我们还通过一个故事来...
赞
评论
分享
月来客栈
4年前
关注
神说要有正态分布,于是就有了正态分布。
故事发生的时间是 18 世纪中到 19 世纪初。17、18 世纪是科学发展的黄金年代,微积分的发展和牛顿万有引力定律的建立,直接的推动了天文学和测地学的迅猛发展。这些天文学...
赞
评论
分享
月来客栈
4年前
关注
线性回归(多变量与多项式回归)
在上一篇文章中笔者详细的介绍了什么是线性回归以及一个典型的应用场景,同时还介绍了如何通过开源的sklearn来搭建一个简单的线性回归模型,使得对于线性回归的核心思想有了一定...
赞
评论
分享
月来客栈
4年前
关注
LSTM与GRU有什么联系和区别?
如图所示,左边为第一种形式也是网上常见的GRU画法。但是为了方便和LSTM对比,我画成了右边的形式,请先行对比。 然后我们再来将LSTM与上面右边的GRU结构放到一起进行对...
赞
评论
分享
下一页
个人成就
文章被点赞
8
文章被阅读
16,824
掘力值
436
关注了
1
关注者
6
收藏集
0
关注标签
2
加入于
2020-01-02