本周最值得关注的 10 篇 AI 论文推荐与解读

126 阅读2分钟

本周 AI 领域最值得关注的 10 篇前沿论文分享,涵盖认知模型、多模态、Infra、应用体系等多个领域。我们对每篇文章进行了深度解读,并为大家准备了完整论文内容与解读文档

推荐论文 Top 10

认知模型

1.Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs 上海创智学院OpenMOSS团队和上海AI Lab提出RoPE++:通过虚部扩展突破大语言模型长文本建模瓶颈

2.ARC-AGI Without Pretraining 卡内基梅隆大学Albert Gu提出CompressARC,无需预训练即可解决20%的ARC-AGI评估难题,仅用76K参数实现极致泛化

多模态

3.LongCat-Image Technical Report 美团LongCat团队发布LongCat-Image技术报告:一个6B参数的高效双语图像生成基础模型,在文本渲染和图像编辑上达到业界领先水平

4.Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance 阿里通义实验室提出Wan-Move:通过潜在轨迹引导实现运动可控的视频生成,达到商业级质量

具身智能

5.SIMA 2: A Generalist Embodied Agent for Virtual Worlds For Enhanced Transformers DeepMind推出SIMA 2:基于Gemini的通用具身智能体,实现虚拟世界中的推理、对话与行动

6.From Generated Human Videos to Physically Plausible Robot Trajectories 加州大学伯克利分校与纽约大学Yann Lecun团队提出GenMimic:首个实现人形机器人零样本模仿生成视频中人类动作的通用框架

空间智能

7.Closing the Train-Test Gap in World Models for Gradient-Based Planning 哥伦比亚大学与纽约大学Yann Lecun团队提出在线与对抗世界模型,显著提升基于梯度规划的效率,其性能在10%的计算时间内匹配或超越传统方法

Infra

8.JEPA as a Neural Tokenizer: Learning Robust Speech Representations with Density Adaptive Attention AI4science 纽约大学Yann Lecun团队与CMU联合提出JEPA-DAAM:通过密度自适应注意力实现2.5Hz超低帧率语音表征学习,达成47.5 tokens/秒的高效神经编解码器

9.FALCON: Few-step Accurate Likelihoods for Continuous Flows Mila Yoshua Bengio团队与哈佛大学的研究团队提出FALCON,通过混合训练目标实现了分子玻尔兹曼采样的百倍加速

Agent

10.Nex-N1: Agentic Models Trained via a Unified Ecosystem for Large-Scale Environment Construction 上海创智学院Nex-AGI团队发布Nex-N1技术报告:通过统一生态系统构建大规模环境训练的智能体模型,在SWE-bench等复杂任务上超越主流开源模型

奇绩信号 Alpha Sight:

依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态

封面.png

xhs.png

xhs (2).png

xhs (3).png

xhs (4).png