首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Weekly Papers
叶子的技术碎碎念
创建于2024-02-18
订阅专栏
每周AI论文速递,来源于Huggingface的Daily Papers,选择其中比较热门的论文。
等 28 人订阅
共75篇文章
创建于2024-02-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
每周AI论文速递(250901-250905)
A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code A.S.E: 面向 AI 生成代码安全
每周AI论文速递(250825-250829)
InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency Inter
每周AI论文速递(250818-250822)
Intern-S1: A Scientific Multimodal Foundation Model Intern-S1:科学多模态基础模型 近年来,大量开源基础模型不断涌现,在诸多热门领域取得显著
每周AI论文速递(250811-250815)
GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models GLM-4.5: 智能体、推理与编码(ARC)基础模型 我们推出 GLM
每周AI论文速递(250804-250808)
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens 大语言模型的思维链推理是海市蜃楼吗?基于数据分布的视角
每周AI论文速递(250728-250801)
Agentic Reinforced Policy Optimization 智能体强化策略优化 具备可验证奖励机制的大规模强化学习(RLVR)已证实其在挖掘大语言模型(LLM)单次推理任务潜力方面的
每周AI论文速递(250721-250725)
GUI-G^2: Gaussian Reward Modeling for GUI Grounding GUI-G^2:基于高斯奖励建模的图形用户界面定位 图形用户界面 (Graphical User
每周AI论文速递(250714-250718)
A Survey of Context Engineering for Large Language Models 大语言模型上下文工程研究综述 大语言模型 (LLM) 的推理性能本质上取决于其所接收
每周AI论文速递(250707-250711)
Scaling RL to Long Videos 将强化学习扩展至长视频处理 我们提出一个端到端框架,通过强化学习将视觉语言模型(VLMs)的推理能力扩展至长视频领域。针对长视频推理的独特挑战,我们
每周AI论文速递(250630-250704)
GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning GLM-4
每周AI论文速递(250623-250627)
Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights 拖放式大语言模型:零样本提示到权重 现代参数高效微调 (Parameter-Efficient Fine
每周AI论文速递(2506216-250620)
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention MiniMax-M1:基于闪电注意力的高效推理计算
每周AI论文速递(2506209-250613)
Reinforcement Pre-Training 强化预训练 本研究提出强化预训练 (RPT) 作为大语言模型和强化学习 (RL) 的新型扩展方法。具体而言,我们将下一 token 预测重构为基于
每周AI论文速递(2506202-250606)
Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning 反思、重试、奖励:通过强化学习实现大语言模型的自我提升 我
每周AI论文速递(250526-250530)
Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model Mutarjim:基于
每周AI论文速递(250519-250523)
Qwen3 Technical Report Qwen3 技术报告 本文介绍 Qwen 模型家族的最新版本 Qwen3。该系列包含基于密集架构和混合专家(Mixture-of-Expert, MoE)
每周AI论文速递(250512-250516)
Seed1.5-VL Technical Report Seed1.5-VL 技术报告 我们提出 Seed1.5-VL,这是一个旨在提升通用多模态理解与推理能力的视觉-语言基础模型。Seed1.5-V
每周AI论文速递(250505-250509)
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models 感知、推理、思考与规划:大模型多模
每周AI论文速递(250428-250502)
Towards Understanding Camera Motions in Any Video 理解任意视频中的摄像机运动 我们提出了CameraBench,这是一个用于评估和提升摄像机运动理解能
每周AI论文速递(250421-250425)
Kuwain 1.5B: An Arabic SLM via Language Injection Kuwain 1.5B:通过语言注入(Language Injection)构建的阿拉伯语小型语言模
下一页