搞定AI

赞

0

|

搜索文章

8月前

从《WebSailor：让开源大模型变身复杂任务推理高手》出发，揭秘代理模型的进化密码

在人工智能领域快速发展的当下，大语言模型（LLM）已成为推动技术变革的核心力量。然而，在处理复杂信息检索任务时，开源大语言模型与专有系统之间始终存在显著性能差距。阿里巴巴团...

0

评论

8月前

32B 参数媲美 OpenAI！MetaStone-S1 如何用反射生成重塑推理轨迹？

在 AI 模型参数竞赛白热化的今天，MetaStone-S1 横空出世，仅用 32B 参数就实现了与 OpenAI o3-mini 系列相当的推理性能，这一成果不仅打破了 ...

0

评论

9月前

从 MemOS 论文出发，揭秘大语言模型内存管理新范式

当你和 ChatGPT 聊了半小时后，它突然 “失忆”，忘记前面讨论的话题；或者 AI 助手在处理复杂任务时，总是无法调用之前学到的知识 —— 这些问题背后，其实暴露了大语...

0

评论

9月前

KnowRL：基于知识的强化学习

在大型语言模型（LLMs）的实际应用中，幻觉问题已成为阻碍其可靠性的核心挑战。当模型在处理复杂推理任务时，即使输入信息完整，也可能输出与事实相悖的内容，导致错误信息的传播。...

0

评论

9月前

仅靠 “自信” 就能变强？这篇论文颠覆大模型微调认知

在大模型微调领域，通常需要大量标注数据或复杂的人工反馈机制。但最近一篇论文《CONFIDENCE IS ALL YOU NEED: FEW-SHOT RL FINE-TUN...

0

评论

9月前

论文解读：The Illusion of Thinking

大推理模型的 "思维幻觉"：从问题复杂度视角解析推理能力的边界一、引言：当语言模型开始 "思考" 近年来，随着 OpenAI o1、Claude 3.7 Sonnet 等...

0

评论

9月前

大模型推理能力评估：拆解知识与推理的关键维度

在大语言模型（LLMs）技术蓬勃发展的当下，诸如 OpenAI 的 o1/3 和 DeepSeek-R1 等推理增强型模型，在处理复杂任务时展现出了卓越的性能。然而，这些模...

0

评论

10月前

【论文解读】Table-R1：用推理时间扩展让 70 亿参数模型超越 GPT-4.1 的表格推理能力

探秘表格推理：从数据到模型，Table-R1 如何让小模型玩转复杂表格？一、为什么需要专门的表格推理数据集？表格推理和纯文本推理有啥不一样？...

0

评论

10月前

【大模型论文】S1: Simple Test-time Scaling|

用最少的数据，做最强的推理！今天给大家分享一个有意思的研究 ——如何用 1000 个样本就让语言模型学会「深度思考」。先问大家一个问题：如果让 AI 解数学竞赛题，你觉...

0

评论

个人成就

文章被阅读 1,540

加入于

2025-06-02