首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
掘友等级
微信公众号--CV技术指南
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CV技术指南
2月前
关注
专补大模型短板的检索增强有哪些新进展?这篇综述讲明白了
同济大学王昊奋研究员团队联合复旦大学熊赟教授团队发布检索增强生成(RAG)综述,从核心范式,关键技术到未来发展趋势对 RAG 进行了全面梳理。这份工作为研究人员绘制了一幅清...
赞
评论
分享
CV技术指南
2月前
关注
挑战Transformer的新架构Mamba解析以及Pytorch复现
Mamba一直在人工智能界掀起波澜,被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出?本文来详细研究这篇论文。...
赞
评论
分享
CV技术指南
3月前
关注
多模态大模型少样本自适应综述
本文介绍并分析了多模态模型少样本适应方法的研究进展,总结了常用的数据集和实验设置,并比较了不同方法的结果。...
赞
评论
分享
CV技术指南
3月前
关注
顶配版SAM!由分割一切迈向感知一切
智源研究院视觉团队推出以视觉感知为中心的基础模型 TAP (Tokenize Anything via Prompting), 利用视觉提示同时完成任意区域的分割、识别与描...
赞
评论
分享
CV技术指南
3月前
关注
加速Python循环的12种方法,最高可以提速900倍
本文介绍了一些简单的方法,可以将Python for循环的速度提高1.3到900倍。Python内建的一个常用功能是timeit模块。下面几节中我们将使用它来度量循环的当前...
赞
评论
分享
CV技术指南
3月前
关注
Github揽获3k+星!清华开源CogAgent:基于多模态大模型的GUI Agent
本文提出了视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而做出规划和决策,同时,研发了多模态大模型 CogAgent。...
2
评论
分享
CV技术指南
3月前
关注
NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读
今年腾讯 AI Lab 共有 18 篇论文入选NeurIPS(含一篇 Spotlight),内容涵盖机器学习、计算机视觉、自然语言处理等方向,以及 AI 在游戏、基础科学等...
赞
评论
分享
CV技术指南
3月前
关注
NeruIPS 2023 | SegRefiner:通过扩散模型实现高精度图像分割
为了实现高精度的图像分割,来自北京交大、南洋理工、字节跳动等的研究者们引入了一种基于扩散模型Diffusion去逐步提高mask质量的方法。...
赞
评论
分享
CV技术指南
3月前
关注
处理不平衡数据的过采样技术对比总结
常见的过采样技术包括随机过采样、SMOTE(合成少数过采样技术)和ADASYN(不平衡学习的自适应合成采样方法)。随机过采样简单地复制少数样本,而SMOTE和ADASYN策...
赞
评论
分享
CV技术指南
3月前
关注
AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向
今年,腾讯优图实验室共有27篇论文入选,内容涵盖表格结构识别、异常图像生成、医学图像分割等多个研究方向,展示了腾讯优图在人工智能领域的技术能力和学术成果。...
1
评论
分享
CV技术指南
3月前
关注
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态,简单预处理即可接近甚至超...
赞
评论
分享
CV技术指南
3月前
关注
清华提出全新代理注意力范式:Softmax注意力与线性注意力的优雅融合
来自清华大学的研究者提出了一种新的注意力范式 —— 代理注意力 (Agent Attention)。...
赞
评论
分享
CV技术指南
3月前
关注
Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?
Runway 突然发布公告 ,宣称要开发通用世界模型 ,解决AI视频最大难题,未来要用AI模拟世界。...
赞
评论
分享
CV技术指南
4月前
关注
端侧显著性检测新高度,OPPO提出面向真实场景的PSUNet
本文构建一个显著对象匹配数据集HRSON和一个轻量级网络PSUNet。考虑到移动部署框架的高效推理,设计了对称像素置乱模块和轻量级模块TRSU。...
赞
评论
分享
CV技术指南
4月前
关注
将Transformer用于扩散模型,AI 生成视频达到照片级真实感
在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。...
赞
评论
分享
CV技术指南
4月前
关注
KDNet:西工大&同济&中南大学提出一种快速知识蒸馏的车牌检测方法
本文提出了一种基于知识蒸馏的快速CNN方法用于车牌检测。它将知识蒸馏引入到CNN中,以优化参数并快速实现车牌检测器。...
赞
评论
分享
CV技术指南
4月前
关注
MIT斯坦福Transformer最新研究:过度训练让中度模型「涌现」结构泛化能力
斯坦福和MIT的研究人员在最近的研究中发现。如果对Transformer类的模型进行长时间的训练之后,它能获得这种结构性的泛化能力。研究人员将这种现象称为:结构顿悟...
赞
评论
分享
CV技术指南
4月前
关注
何恺明新作:简单框架达成无条件图像生成新SOTA!与MIT合作完成
大佬何恺明和MIT师生一起开发了一个自条件图像生成框架,名叫RCG。这个框架结构非常简单但效果拔群,直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。...
赞
评论
分享
CV技术指南
4月前
关注
小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
在最近的一项研究中,Meta 研究者提出了另外一种改进思路 ——利用 SAM 的掩码图像预训练 (SAMI)。这是通过利用 MAE 预训练方法和 SAM 模型实现的,以获得...
赞
评论
分享
CV技术指南
4月前
关注
NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法
本文首次探索了压缩量化在光谱压缩重建领域的应用,提出了该领域首个二值化卷积神经网络 BiSRNet,在量化指标和视觉结果上都显著地超越了当前最先进的二值化模型。...
赞
评论
分享
下一页
个人成就
文章被点赞
839
文章被阅读
324,985
掘力值
12,743
关注了
0
关注者
297
收藏集
0
关注标签
10
加入于
2021-05-30