首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
掘友等级
微信公众号--CV技术指南
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
CV技术指南
6月前
关注
ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」
本文介绍一种完全无需重新训练模型的视频生成加速方法。通过挖掘注意力机制中的空间与时间稀疏性,配合自适应稀疏选择与算子优化,成功将推理时间减半。...
0
评论
分享
CV技术指南
6月前
关注
ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
清华大学、北京大学联合微软亚洲研究院提出了PMP-based Data Selection(PDS)方法,首次将数据选择建模为最优控制问题。...
0
评论
分享
CV技术指南
7月前
关注
ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%
传统方法聚焦预填充阶段的视觉token压缩,却在解码阶段因文本序列增长而逐渐失效。为此,研究团队提出Dynamic-LLaVA动态优化框架,首创跨阶段协同加速机制。...
0
评论
分享
CV技术指南
7月前
关注
【2025年 即插即用】全网首发,空间条纹注意力SSA,大感受野特征捕获!
本文提出了一种用于图像恢复的双域条带注意力机制(Dual-domain strip attention mechanism),通过增强表示学习来提升图像恢复任务的性能。...
0
评论
分享
CV技术指南
9月前
关注
ICLR 2025|如何在ImageNet-1K上训练视觉基础模型?
仅在ImageNet-1K的1.2M图像上训练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。...
0
评论
分享
CV技术指南
9月前
关注
ICLR 2025 | 精度近乎无损!首个Mamba系列模型量化方案MambaQuant
本文提出了 MambaQuant,这是一种训练后量化(PTQ)框架。该工作对 transformer-based LLM 模型的量化也有很大提升...
0
评论
分享
CV技术指南
9月前
关注
ICLR 2025 | 无需训练的Token级 DiT加速方法
本文提出的 ToCa 模型通过 token 粒度的缓存方法,实现了图像和视频生成模型上无需训练的两倍以上的加速。...
0
评论
分享
CV技术指南
9月前
关注
DeepSeek满血版「火」到微信!国民级应用加持,AI搜索要变天?
微信也接入满血版DeepSeek R1了!一些被灰度到的网友纷纷开启测评,不仅有思考链,还有参考资料。...
0
评论
分享
CV技术指南
9月前
关注
ICLR 2025 | 计算量仅DiT的一半!一个模型架构搞定T2X任务
来自中山大学和360 AI Research的研究人员基于Proxy token提出了一种高效的Diffusion Transformer 即PT-DiT, 能够适用于文本...
0
评论
分享
CV技术指南
9月前
关注
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
本文,来自 Meta 等机构的研究者提出了一种新颖且高效的预训练框架:连续概念混合(Continuous Concept Mixing,),其将离散的下一个 token 预...
0
评论
分享
CV技术指南
9月前
关注
顶刊TPAMI 2025 | 北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建,代码已开源!
本篇分享 TPAMI 2025 论文Invertible Diffusion Models for Compressed Sensing,北大、KAUST、字节联合提出“可...
0
评论
分享
CV技术指南
9月前
关注
ICLR 2025 | 精度近乎无损!首个Mamba系列模型量化方案MambaQuant
本文提出了 MambaQuant,这是一种训练后量化(PTQ)框架,包含:1)基于 Karhunen-Loève 变换(KLT)的增强旋转;2)平滑融合旋转,用于均衡通道方...
0
评论
分享
CV技术指南
9月前
关注
新突破!上海交大重磅新作LIMO:挑战RL Scaling范式
来自上海交通大学的最新研究却给出一个令人震惊的答案:仅需 817 条精心设计的样本,就能让模型在数学竞赛级别的题目上超越当前许多最先进模型,这一发现不仅挑战了传统认知,更揭...
1
评论
分享
CV技术指南
9月前
关注
LLM模型的通病:模型坍塌
模型坍塌是指生成模型由于过度使用低质量数据或对类似模型的输出进行重复微调而导致性能下降的现象。本文展示了模型坍塌在不同机器学习模型中的存在及其对大型语言模型的影响。...
0
评论
分享
CV技术指南
12月前
关注
无循环无卷积!上海交大提出时空预测学习新里程碑PredFormer
时空预测,真的需要 RNN 吗?真的需要 CNN 吗?是否能够设计一个模型,可以自动地学习数据中的时空依赖,而不需要依赖于归纳偏置呢?...
0
评论
分享
CV技术指南
12月前
关注
NeurIPS2024 | 提高专业生产力,让你的AI画作布局可控,360 AI Research开源新模型HiCo
基于HiCo模型,使用者可以对生成画面中的不同主体的布局进行自由控制和调整,实现“指哪打哪”的生成效果。...
0
评论
分享
CV技术指南
1年前
关注
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
当模型在这样一个不平衡数据集上训练时,由于某个类别的样本数量远多于其他类别,模型通常会更擅长预测样本量较大的类别,而在预测小类别时表现不佳。为了缓解这一问题,可以使用过采样...
0
评论
分享
CV技术指南
1年前
关注
ECCV 2024 | 视觉定位新SOTA!将视觉定位的目标边界框转化为分割信号
在本研究中,提出了一个名为 SegVG 的新方法,旨在将边界框级的注释转化为分割信号,以提供更为丰富的监督信号。...
0
评论
分享
CV技术指南
1年前
关注
标签贴错,AMD召回所有新一代CPU
上个月,AMD 首席执行官苏姿丰博士在 ComputeX 开幕主题演讲上揭开了 Zen 5 架构的神秘面纱。作为 AMD 未来几年 CPU 的台柱子,Zen 5 立刻被引入...
0
评论
分享
下一页
个人成就
文章被点赞
859
文章被阅读
450,452
掘力值
13,817
关注了
0
关注者
348
收藏集
0
关注标签
10
加入于
2021-05-30