首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
掘友等级
微信公众号--CV技术指南
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
ICML 2025 | 多模态理论研究 | 深入探究模态崩溃的理论成因!
本文提出了一种通过显式基重新分配来防止模态崩溃的算法,并应用于处理缺失模态。在多个多模态基准上进行的大量实验验证理论主张。
ACL 2025 最佳论文解读 | LLM注定是稀疏架构
本文结合算法创新与硬件友好的优化设计,实现了高效的长上下文建模。NSA采用动态分层稀疏策略,将粗粒度的token压缩与细粒度的token选择相结合,从而同时保留全局上下文感知与局部精确性。
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
OpenAI在最新的开源模型gpt-oss上采用的MXFP4数据类型,直接让推理成本暴降 75 %!
告别Transformer?上海交大「原生类脑」BriLLM首秀:信号流重塑大模型范式
为了解决现有基于 Transformer 大模型的三个主要缺陷:算力需求高、不可解释性的黑箱、上下文规模受限,上海交通大学团队刚刚发布首个宏观模拟人类大脑全局机制的大语言模型 BriLLM。
ICCV 2025 | 无需微调,Stable Diffusion解锁视觉上下文学习新范式
近日,来自苹果公司和马里兰大学的研究团队发表了一篇引人注目的论文。该研究发现,所熟知的预训练文本到图像生成模型——Stable Diffusion,无需任何额外的微调。
经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
本文,来自德国吕贝克大学等机构的研究者引入了一种新颖的方法:SUGAR(Surrogate Gradient for ReLU),在不牺牲 ReLU 优势的情况下解决了 ReLU 的局限性。
CVPR 2025 | Meta提出FovealSeg:毫秒级IOI分割
最近,一项来自纽约大学和 Meta Reality Labs 的联合研究引发了行业关注:Foveated Instance Segmentation —— 一种结合眼动追踪信息进行实例分割的新方法。
CVPR 2025 Oral | 中科院、中山大学等提出真实世界去雨模型VDMamba,效果好、速度快、兼顾增强下游视觉任务
中科院、中山大学等提出真实世界去雨模型VDMamba,效果好、速度快、兼顾增强下游视觉任务,已被CVPR2025录用。
CVPR 2025|AnomalyAny:异常检测新工作,利用Stable Diffusion生成真实多样异常样本!
本文介绍了一种名为AnomalyAny的创新框架,它利用Stable Diffusion的强大生成能力,仅需单个正常样本和文本描述,即可生成逼真且多样化的异常样本。
长推理≠高精度!自适应切换“秒答”与“深思”:省Token与提精度的双赢哲学
长 CoT 推理并非总能提升准确率,甚至会削弱模型处理简单任务的能力。为此,本文提出基于置信度的自适应推理框架(CAR),它能根据模型困惑度动态选择短回答或详细的长文本推理。
下一页
个人成就
文章被点赞
855
文章被阅读
426,037
掘力值
13,755
关注了
0
关注者
342
收藏集
0
关注标签
10
加入于
2021-05-30