首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
掘友等级
微信公众号--CV技术指南
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CV技术指南
1年前
关注
Transformers 加速的一些常用技巧
Transformers 是一个强大的架构,但同时也容易导致在训练过程中出现OOM或者达到GPU的运行时限,本文介绍了一些Transformers常用的加速策略。...
0
评论
分享
CV技术指南
1年前
关注
BiTCN:基于卷积网络的多元时间序列预测
本文将详细介绍了BiTCN,这是2023年3月在《Parameter-efficient deep probabilistic forecasting》一文中提出的模型。...
0
评论
分享
CV技术指南
1年前
关注
LSTM卷土重来!xLSTM:一举超越Mamba、Transformer!
当人们都以为 Transformer 在语言模型领域稳坐江山的时候,LSTM 又杀回来了 —— 这次,是以 xLSTM 的身份。5 月 8 日,LSTM 提出者和奠基者Se...
0
评论
分享
CV技术指南
1年前
关注
ICML 2024 | 文生图新SOTA!Pika北大斯坦福联合推出RPG:多模态助力解决文生图两大难题
近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3。...
0
评论
分享
CV技术指南
1年前
关注
ICLR 2024 杰出论文奖出炉!两篇国内论文获得提名!
ICLR 全称为国际学习表征会议,今年举办的是第十二届,于 5 月 7 日至 11 日在奥地利维也纳展览会议中心举办。本届会议共收到了 7262 篇提交论文,接收 2260...
0
评论
分享
CV技术指南
1年前
关注
CVPR 2024 | 字节提出视觉基础模型:ViTamin,实现多项SOTA!
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。...
0
评论
分享
CV技术指南
1年前
关注
即插即用!上交提出Long-CLIP:解锁CLIP的长文本功能
本文介绍的工作在CLIP的基础上,提出了具有长文本能力的Long-CLIP,弥补了CLIP在长文本建模上的重大短板,并可以即插即用地利用在各种多模态任务中。...
0
评论
分享
CV技术指南
1年前
关注
讨论下一个token预测时,我们可能正在走进陷阱
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。...
0
评论
分享
CV技术指南
1年前
关注
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。...
0
评论
分享
CV技术指南
1年前
关注
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
来自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。...
0
评论
分享
CV技术指南
1年前
关注
佐治亚大学Intelligent Vision and Sensing实验室招收计算机视觉/深度学习/机器人/自动驾驶方向博士生
佐治亚大学Intelligent Vision and Sensing实验室招收计算机视觉/深度学习/机器人/自动驾驶方向博士生...
0
评论
分享
CV技术指南
1年前
关注
CVPR2024 | Point Transformer V3: 更简单、更快、更强!
本文提出了Point TransformerV3(PTv3),它将简单性和效率置于某些机制的准确性之上。...
0
评论
分享
CV技术指南
1年前
关注
LLM 加速技巧:Muti Query Attention
MQA 是 19 年提出的一种新的 Attention 机制,其能够在保证模型效果的同时加快 decoder 生成 token 的速度。...
2
评论
分享
CV技术指南
1年前
关注
ICLR 2024|图像匹配新突破!GIM:首个从互联网视频中学习通用图像匹配器的框架
为了解决基于深度学习方法泛化性的问题 ,来自厦门大学、Intel 、大疆的研究者们提出了 GIM 。...
0
评论
分享
CV技术指南
1年前
关注
Pytorch中张量的高级选择操作
在某些情况下,我们需要用Pytorch做一些高级的索引/选择,所以在这篇文章中,将介绍这类任务的三种最常见的方法。...
0
评论
分享
CV技术指南
1年前
关注
CVPR 2024 满分论文!Meta提出EfficientSAM:快速分割一切!
Meta 研究者提出了一种改进思路,利用 SAM 的掩码图像预训练 (SAMI)。这是通过利用 MAE 预训练方法和 SAM 模型实现的,以获得高质量的预训练 ViT 编码...
0
评论
分享
CV技术指南
1年前
关注
ICLR 2024 | 国内高校打造类Sora模型VDT,通用视频扩散Transformer
研究团队提出了基于 Transformer 的 Video 统一生成框架 - Video Diffusion Transformer (VDT),并对采用Transform...
0
评论
分享
CV技术指南
1年前
关注
补齐Transformer规划短板,田渊栋团队的Searchformer火了
Transformer 强大的泛化能力再次得到证明!最近几年,基于 Transformer 的架构在多种任务上都表现卓越,吸引了世界的瞩目。...
0
评论
分享
CV技术指南
1年前
关注
Swin-UMamba:基于Mamba和ImageNet预训练的医学图像分割模型
本文提出了Swin-UMamba,借助ImageNet预训练模型的力量进一步提升基于Mamba的模型在医学图像分割任务中的性能。...
0
评论
分享
CV技术指南
1年前
关注
视觉类表面缺陷检测项目相关技术总结
本文不仅仅涉及的是技术,也有一些对于项目管理,需求沟通的相关的内容,算是自己的一点点感悟。表面缺陷检测项目,同事更多称之为“质检项目”。...
0
评论
分享
下一页
个人成就
文章被点赞
859
文章被阅读
450,469
掘力值
13,817
关注了
0
关注者
348
收藏集
0
关注标签
10
加入于
2021-05-30