首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
多模态
Q同学
创建于2024-04-13
订阅专栏
多模态
暂无订阅
共2篇文章
创建于2024-04-13
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
CLIP论文笔记:Learning Transferable Visual Models From Natural Language Supervision
导语 会议:ICML 2021 链接:https://proceedings.mlr.press/v139/radford21a/radford21a.pdf 当前的计算机视觉系统通常只能识别预先设定
ViT论文笔记:An image is worth 16x16 words- Transformers for image recognition
导语 会议:ICLR 2021 链接:https://arxiv.org/pdf/2010.11929.pdf 虽然Transformer架构已成为NLP任务的事实标准,但其在计算机视觉领域的应用仍然