Weekly Papers

Weekly Papers

Weekly Papers

每周AI论文速递，来源于Huggingface的Daily Papers，选择其中比较热门的论文。

等 34 人订阅共90篇文章创建于2024-02-18

每周AI论文速递（250224-250228）

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers LLM-Micr

10月前
292
1
评论

每周AI论文速递（250217-250221）

Large Language Diffusion Models 大语言扩散模型自回归模型 (ARMs) 被广泛认为是大语言模型 (LLMs) 的基础。我们通过引入 LLaDA 来质疑这一观点，LLa

10月前
463
点赞
评论

每周AI论文速递（250210-250214）

利用隐式推理扩大测试时间计算的深度：一种循环深度方法利用隐式推理扩大测试时间计算的深度：一种循环深度方法我们研究了一种新型的语言模型架构，该架构能够通过在潜在空间中进行隐式推理来扩展测试时的计算。

10月前
423
点赞
1

每周AI论文速递（250203-250207）

s1: Simple test- time scaling s1: 测试时间缩放研究测试时间缩放是一种创新的语言建模方法，通过额外的计算资源提升模型性能。近期，OpenAI 的 o1 模型展示了这一

10月前
417
点赞
评论

每周AI论文速递（250127-250131）

Humanity's Last Exam 人类的最终考试基准测试是追踪大语言模型(LLM)能力快速进展的重要工具。然而，这些基准测试在难度上并未跟上节奏:如今的 LLMs 在 MMLU 等流行基准测

11月前
486
点赞
评论

每周AI论文速递（250120-250124）

Evolving Deeper LLM Thinking 大语言模型思维的深度进化我们探索了一种进化搜索策略，用于扩展大语言模型中的推理计算时间。我们提出的方法，Mind Evolution，利用语

11月前
412
2
评论

每周AI论文速递（250113-250117）

Enabling Scalable Oversight via Self-Evolving Critic 通过自我进化的批评者实现可扩展的监督尽管大语言模型 (LLMs) 表现卓越，但其发展面临一个

11月前
249
点赞
评论

每周AI论文速递（250106-250110）

EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation EnerVerse: Envisioning Embodi

11月前
249
1
评论

每周AI论文速递（241230-250103）

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs HuatuoGPT-o1, 面向医学复杂推理的大语言模型 OpenAI 的 GPT-

11月前
358
点赞
评论

每周AI论文速递（241223-241227）

Parallelized Autoregressive Visual Generation 并行化自回归视觉生成自回归模型是视觉生成的一种强大方法，但由于其逐 Token 的序列预测过程，导致推理速

1年前
153
点赞
评论

每周AI论文速递（241216-241220）

Apollo: An Exploration of Video Understanding in Large Multimodal Models Apollo: 大语言模型中视频理解探索尽管视频感知

1年前
298
6
评论

每周AI论文速递（241209-241213）

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Sc

1年前
264
点赞
评论

每周AI论文速递（241202-241206）

GRAPE: Generalizing Robot Policy via Preference Alignment GRAPE: 通过偏好对齐泛化机器人策略尽管视觉-语言-动作 (VLA) 模型在多

1年前
385
2
评论

每周AI论文速递（241125-241129）

TÜLU 3: Pushing Frontiers in Open Language Model Post-Training TÜLU 3: 推动开放语言模型后训练的前沿语言模型后训练用于精炼行为并

1年前
302
点赞
评论

每周AI论文速递（241118-241122）

LLaVA-o1: Let Vision Language Models Reason Step-by-Step LLaVA-o1: 让视觉语言模型逐步推理大语言模型在推理能力上取得了显著进展，尤其

1年前
193
点赞
评论

每周AI论文速递（241028-241101）

ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting ROCKET-1: 掌握开放世界交互与视觉

1年前
170
点赞
评论

每周AI论文速递（241021-241025）

UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models UCFE: 一个面向大语言模型的用户中心化金融

1年前
218
1
评论

每周AI论文速递（241014-241018）

Baichuan-Omni Technical Report Baichuan-Omni 技术报告 GPT-4o 在多模态能力和交互体验方面的显著表现，使其在实际应用中扮演了重要角色，但目前尚无高性能

1年前
186
点赞
评论

每周AI论文速递（241007-241011）

Addition is All You Need for Energy-efficient Language Models 加法即所需：高效能语言模型大型神经网络在浮点张量乘法上耗费了大量计算资源。

1年前
236
点赞
评论

每周AI论文速递（240930-241004）

Emu3: Next-Token Prediction is All You Need Emu3: 下一个 Token 预测的全部尽管下一个 Token 预测被视为通向人工通用智能的有力途径，但在多

1年前
640
1
评论