首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
掘友等级
微信公众号--CV技术指南
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CV技术指南
1年前
关注
Diffusion反馈强势助力CLIP秒变火眼金睛:北京智源研究院、中科院自动化所联合推出DIVA
本文分享论文Diffusion Feedback Helps CLIP See Better,专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。...
0
评论
分享
CV技术指南
1年前
关注
ECCV24|全局式SfM最新SOTA,GLOMAP重新定义SfM!
ETH&微软最新开源-全局式GLOMAP,它与以前的全局SfM系统相比,其核心区别在于全局定位步骤。...
0
评论
分享
CV技术指南
1年前
关注
英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强
业界出现了另一种趋势,即开发小型语言模型 (SLM),这种模型在许多语言任务中表现足够出色,部署起来也非常便宜。最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结合,可以从...
0
评论
分享
CV技术指南
1年前
关注
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。...
0
评论
分享
CV技术指南
1年前
关注
ICML 2024 | 全新图卷积!Mila和华为提出CKGConv:连续卷积核的图卷积网络
在ICML2024上,来自麦吉尔大学, Mila魁北克人工智能研究所以及华为诺亚方舟实验室的研究者发表了一个基于连续卷积核(continuous kernel)的全新图卷积...
0
评论
分享
CV技术指南
1年前
关注
Transformer作者预警:只卖模型玩不过OpenAI!
只卖模型真的不赚钱!在这次与20VC主理人Harry Stebbings的对话中,Aidan Gomez大谈特谈AI的发展趋势。...
0
评论
分享
CV技术指南
1年前
关注
InstantStyleGaussian:利用3D Gaussian Splatting实现高效艺术风格迁移
本文介绍了InstantStyleGaussian,这是一种基于三维高斯飞溅(3DGS)场景表示的创新三维风格迁移方法。通过输入目标风格图像,它能够快速生成新的三维GS场景...
0
评论
分享
CV技术指南
1年前
关注
TPAMI 2024 | 自适应区域特定损失:提高图像分割性能
本文引入了一个区域特定的损失来提升隐含的均匀加权假设,以实现更好的学习,将整个体积划分为多个子区域,每个子区域都构建了一个针对最佳局部性能的个性化损失。...
0
评论
分享
CV技术指南
1年前
关注
SAM已经Out了!TS-SAM:适应下游任务的分割一切!
本文通过设计一种统一的微调策略来解决自注意力机制(Self-Attention Mechanism,SAM)在各种下游任务中表现次优的挑战,以提升SAM在不同应用场景下的有...
0
评论
分享
CV技术指南
1年前
关注
顶刊TPAMI 2024 | PERF:一张2D全景图可合成高质量的360度3D场景
本文提出了一种新的方法解决单张 2D 全景图恢复 360 度 3D 全景问题,利用扩散模型的先验知识和单目深度估计器进行合作修补大尺度遮挡区域,并提出了一种新的冲突避免策略...
0
评论
分享
CV技术指南
1年前
关注
ICML 2024 | 新型傅立叶微调来了!脱离LoRA架构,训练参数大幅减少
本文介绍了香港科技大学(广州)的一篇关于大模型高效微调(LLM PEFT Fine-tuning)的文章,本文被 ICML 2024 接收,代码已开源。...
0
评论
分享
CV技术指南
1年前
关注
检测一切!Grounding DINO 1.5:最强开集目标检测模型
目标检测领域,迎来了新进展——Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。...
0
评论
分享
CV技术指南
1年前
关注
顶刊IJCV 2024 | EfficientSCI++:高效的视频单曝光压缩成像重建框架
来自浙江大学和西湖大学的研究人员提出了一种基于 CNN-Transformer 架构的高效、大尺度视频单曝光压缩成像重建算法 EfficientSCI++。...
0
评论
分享
CV技术指南
1年前
关注
CVPR 2024 | 谷歌提出OmniGlue:特征匹配新工作
近日,受上述观察的启发,德克萨斯大学奥斯汀分校和谷歌研究院的研究者联合提出了 OmniGlue,这是第一个以泛化为核心原则设计的可学习图像匹配器。...
0
评论
分享
CV技术指南
1年前
关注
迁移科技招聘 | 来自研发及销售岗位的心动Offer,@视觉人才请查收!
本期发布的岗位有:硬件系统工程师(北京)、RSDE视觉算法工程师(北京)、海外销售经理(北京)、大客户销售经理(北京/深圳/广州/上海/苏州/合肥/长春/青岛/重庆/长沙)...
0
评论
分享
CV技术指南
1年前
关注
无位置编码 (NoPE) 也有长度泛化问题?首个针对NoPE的长度外推方法
NoPE 的长度泛化问题并没有改善,和 RoPE 一样严重。华师、复旦、上海 AI Lab 联合团队基于 NoPE,在排除位置编码影响下,研究长度泛化失败的表现和原因,并首...
0
评论
分享
CV技术指南
1年前
关注
视觉Mamba的多向扫描策略真的有效吗?
本文对主流的扫描方向及其组合对遥感图像语义分割的影响进行了全面的实验研究,对于高分辨率遥感图像的语义分割,简单的单一扫描方向已经足够。...
0
1
分享
CV技术指南
1年前
关注
Transformers 加速的一些常用技巧
Transformers 是一个强大的架构,但模型因其采用的自注意力机制容易导致在训练过程中出现OOM,本文介绍了一些Transformers常用的加速策略。...
0
评论
分享
CV技术指南
1年前
关注
RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层!
本研究提出了RepVGG-GELAN,这是一种新型的YOLO架构,通过集成RepVGG,一种重新参数化的卷积方法,特别关注于医学图像中的脑肿瘤检测。...
0
评论
分享
CV技术指南
1年前
关注
信息融合是Occupancy任务必要的吗?工业界是怎么做的?
最近OCC的综述很多,这两天arxiv上又挂出来一篇,从信息融合的角度全面回顾了占用网络的相关工作,值得一看!...
0
评论
分享
下一页
个人成就
文章被点赞
859
文章被阅读
450,469
掘力值
13,817
关注了
0
关注者
348
收藏集
0
关注标签
10
加入于
2021-05-30