首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
moka11moka
掘友等级
中国社会主义泥瓦匠
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
leetcode206 反转链表
给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 如图所示: 比较直观的思路,通过保存两个指针,pre和cur来记录前后两个节点,当需要翻转是,就可以把c...
赞
评论
分享
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
Prompt和P-tuning日常学习
简介 日常学习苏神的笔记,小伙伴感兴趣一定要去看原文,毕竟我的理解和苏神不在一个层次上。原文链接如下:必须要GPT3吗?不,BERT的MLM模型也能小样本学习 当年GP...
赞
评论
分享
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
标准的Attention到稀疏Attention
简介 依旧借鉴苏神的博客【为节约而生:从标准Attention到稀疏Attention】进行复述和整合,基本都是苏神内容,但打字是我打的。...
2
评论
分享
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
字标注与HMM模型
简介 以下文章基本借鉴于苏神的【字标注法与HMM模型】,如有兴趣可以参考原文。本人纯为加深理解,所以在此复述一遍。 字标注法 字标注法是通过给每个字打上一个标签来进行分词,...
1
评论
分享
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
知识蒸馏中的温度参数(2)
1、温度常数简介 由上一篇我所写知识蒸馏中的温度参数(1)中我介绍了知识蒸馏以及具体的损失函数的表达式。其中损失函数中: 其中Lsoft中就涉及到了常数T,而T有应该设...
1
评论
分享
moka11moka
中国社会主义泥瓦匠
·
1年前
关注
知识蒸馏中的温度参数(1)
知识蒸馏:一种“教师 -> 学生”的模型压缩方法。使得学生模型在表现的足够好的前提下,还能够大大提升推理速度,减少内存占用,便于线上部署。...
1
评论
分享
个人成就
文章被点赞
5
文章被阅读
5,379
掘力值
138
关注了
0
关注者
0
收藏集
0
关注标签
5
加入于
2022-05-28