首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
搞定AI
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
搞定AI
6月前
关注
从《WebSailor:让开源大模型变身复杂任务推理高手》出发,揭秘代理模型的进化密码
在人工智能领域快速发展的当下,大语言模型(LLM)已成为推动技术变革的核心力量。然而,在处理复杂信息检索任务时,开源大语言模型与专有系统之间始终存在显著性能差距。阿里巴巴团...
0
评论
分享
搞定AI
6月前
关注
32B 参数媲美 OpenAI!MetaStone-S1 如何用反射生成重塑推理轨迹?
在 AI 模型参数竞赛白热化的今天,MetaStone-S1 横空出世,仅用 32B 参数就实现了与 OpenAI o3-mini 系列相当的推理性能,这一成果不仅打破了 ...
0
评论
分享
搞定AI
7月前
关注
从 MemOS 论文出发,揭秘大语言模型内存管理新范式
当你和 ChatGPT 聊了半小时后,它突然 “失忆”,忘记前面讨论的话题;或者 AI 助手在处理复杂任务时,总是无法调用之前学到的知识 —— 这些问题背后,其实暴露了大语...
0
评论
分享
搞定AI
7月前
关注
KnowRL:基于知识的强化学习
在大型语言模型(LLMs)的实际应用中,幻觉问题已成为阻碍其可靠性的核心挑战。当模型在处理复杂推理任务时,即使输入信息完整,也可能输出与事实相悖的内容,导致错误信息的传播。...
0
评论
分享
搞定AI
7月前
关注
仅靠 “自信” 就能变强?这篇论文颠覆大模型微调认知
在大模型微调领域,通常需要大量标注数据或复杂的人工反馈机制。但最近一篇论文《CONFIDENCE IS ALL YOU NEED: FEW-SHOT RL FINE-TUN...
0
评论
分享
搞定AI
7月前
关注
论文解读:The Illusion of Thinking
大推理模型的 "思维幻觉":从问题复杂度视角解析推理能力的边界 一、引言:当语言模型开始 "思考" 近年来,随着 OpenAI o1、Claude 3.7 Sonnet 等...
0
评论
分享
搞定AI
7月前
关注
大模型推理能力评估:拆解知识与推理的关键维度
在大语言模型(LLMs)技术蓬勃发展的当下,诸如 OpenAI 的 o1/3 和 DeepSeek-R1 等推理增强型模型,在处理复杂任务时展现出了卓越的性能。然而,这些模...
0
评论
分享
搞定AI
8月前
关注
【论文解读】Table-R1:用推理时间扩展让 70 亿参数模型超越 GPT-4.1 的表格推理能力
探秘表格推理:从数据到模型,Table-R1 如何让小模型玩转复杂表格? 一、为什么需要专门的表格推理数据集? 表格推理和纯文本推理有啥不一样?...
0
评论
分享
搞定AI
8月前
关注
【大模型论文】S1: Simple Test-time Scaling|
用最少的数据,做最强的推理! 今天给大家分享一个有意思的研究 ——如何用 1000 个样本就让语言模型学会「深度思考」。 先问大家一个问题:如果让 AI 解数学竞赛题,你觉...
0
评论
分享
个人成就
文章被阅读
1,101
掘力值
92
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2025-06-02