首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Weekly Papers
叶子的技术碎碎念
创建于2024-02-18
订阅专栏
每周AI论文速递,来源于Huggingface的Daily Papers,选择其中比较热门的论文。
等 21 人订阅
共61篇文章
创建于2024-02-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
每周AI论文速递(250526-250530)
Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model Mutarjim:基于
每周AI论文速递(250519-250523)
Qwen3 Technical Report Qwen3 技术报告 本文介绍 Qwen 模型家族的最新版本 Qwen3。该系列包含基于密集架构和混合专家(Mixture-of-Expert, MoE)
每周AI论文速递(250512-250516)
Seed1.5-VL Technical Report Seed1.5-VL 技术报告 我们提出 Seed1.5-VL,这是一个旨在提升通用多模态理解与推理能力的视觉-语言基础模型。Seed1.5-V
每周AI论文速递(250505-250509)
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models 感知、推理、思考与规划:大模型多模
每周AI论文速递(250428-250502)
Towards Understanding Camera Motions in Any Video 理解任意视频中的摄像机运动 我们提出了CameraBench,这是一个用于评估和提升摄像机运动理解能
每周AI论文速递(250421-250425)
Kuwain 1.5B: An Arabic SLM via Language Injection Kuwain 1.5B:通过语言注入(Language Injection)构建的阿拉伯语小型语言模
每周AI论文速递(250414-250418)
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models Inter
每周AI论文速递(250407-250411)
SmolVLM: Redefining small and efficient multimodal models SmolVLM:重新定义小型高效多模态模型 虽然大型视觉语言模型 (VLMs) 具备
每周AI论文速递(250331-250404)
Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Coll
每周AI论文速递(250317-250321)
RWKV-7 "Goose" with Expressive Dynamic State Evolution RWKV-7 "Goose":具备动态状态演化能力的架构 本文提出 RWKV-7 "Goo
每周AI论文速递(250310-250314)
Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders 使用稀疏自编码器进行生成文本检测的特征级洞
每周AI论文速递(250224-250228)
LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers LLM-Micr
每周AI论文速递(250217-250221)
Large Language Diffusion Models 大语言扩散模型 自回归模型 (ARMs) 被广泛认为是大语言模型 (LLMs) 的基础。我们通过引入 LLaDA 来质疑这一观点,LLa
每周AI论文速递(250210-250214)
利用隐式推理扩大测试时间计算的深度:一种循环深度方法 利用隐式推理扩大测试时间计算的深度:一种循环深度方法 我们研究了一种新型的语言模型架构,该架构能够通过在潜在空间中进行隐式推理来扩展测试时的计算。
每周AI论文速递(250203-250207)
s1: Simple test- time scaling s1: 测试时间缩放研究 测试时间缩放是一种创新的语言建模方法,通过额外的计算资源提升模型性能。近期,OpenAI 的 o1 模型展示了这一
每周AI论文速递(250127-250131)
Humanity's Last Exam 人类的最终考试 基准测试是追踪大语言模型(LLM)能力快速进展的重要工具。然而,这些基准测试在难度上并未跟上节奏:如今的 LLMs 在 MMLU 等流行基准测
每周AI论文速递(250120-250124)
Evolving Deeper LLM Thinking 大语言模型思维的深度进化 我们探索了一种进化搜索策略,用于扩展大语言模型中的推理计算时间。我们提出的方法,Mind Evolution,利用语
每周AI论文速递(250113-250117)
Enabling Scalable Oversight via Self-Evolving Critic 通过自我进化的批评者实现可扩展的监督 尽管大语言模型 (LLMs) 表现卓越,但其发展面临一个
每周AI论文速递(250106-250110)
EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation EnerVerse: Envisioning Embodi
每周AI论文速递(241230-250103)
HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs HuatuoGPT-o1, 面向医学复杂推理的大语言模型 OpenAI 的 GPT-
下一页