首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
论文阅读
Lvri
创建于2023-12-05
订阅专栏
记录自己的论文阅读与相关想法
暂无订阅
共2篇文章
创建于2023-12-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
ViT: Vision Transformers
ViT 试图将 Transformers 架构应用在图像分类上,它所做的工作更多的是为 Transformer 设计一个接口。本篇讨论了论文中的一些细节,包括 inductive bias 和实验结果
Mistral 7B
Mistral 7B 是小模型的典型例子,本文简单介绍了它使用的 GQA 与 SWA 两种技术改进。