首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Q同学
掘友等级
学生
研究生在读,个人主页:https://jiexingqi.github.io/
获得徽章 9
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1.7K
文章 1.6K
沸点 46
赞
1.7K
返回
|
搜索文章
Q同学
赞了这篇沸点
SSYY
资深摸鱼专家
·
1月前
举报
JYM,那个礼品兑换每天几点更新啊, 怎么每次看都是今日已抢光
赞过
分享
4
3
Q同学
学生
·
1月前
举报
请问奖品啥时候上架啊,每天不开放,没有的话能不能删掉啊
收起
查看大图
向左旋转
向右旋转
反馈 & 建议
赞过
分享
评论
1
Q同学
学生
·
1月前
关注
阿里WebDancer:自主信息搜索Agent
摘要 随着大语言模型(LLMs)和大推理模型(LRMs)的能力不断提升,构建具备长期任务规划与复杂信息检索能力的智能体Agent成为关键研究方向。阿里通义实验室提出WebD...
1
评论
分享
Q同学
学生
·
1月前
关注
阿里WebSailor:超越人类的推理Web Agent
摘要 WebSailor 是一套开源智能体训练方法,旨在提升其在复杂信息检索任务中的超人类推理能力。现有开源网页智能体在 BrowseComp-en/zh 等任务中几乎无法...
0
评论
分享
Q同学
学生
·
1月前
关注
Kimi-K2论文解读
摘要 Kimi在近期发布了最大规模开源模型K2,其为MOE架构,包含1.04T参数,32B激活,。K2 重点强调了其大规模的智能体(agentic)数据合成流水线和联合强化...
1
评论
分享
Q同学
学生
·
1月前
关注
SciMaster:无需微调,在人类最后考试上刷新 SOTA
摘要 随着 AI Agent的发展,人们期待其在科学发现中发挥关键作用。本文提出 X-Master,一种工具增强型通用推理Agent(tool-augmented reas...
1
评论
分享
Q同学
赞了这篇沸点
只会写Bug
小前端
·
1月前
举报
咋不补货了???啥也兑换不了!!!!
收起
查看大图
向左旋转
向右旋转
上班摸鱼
赞过
分享
评论
2
Q同学
赞了这篇沸点
xiaoChen
前端开发
·
2月前
举报
福利兑换的商品咋还不更新啊
赞过
分享
评论
2
Q同学
学生
·
3月前
关注
ChatGPT使用限额记录与插件统计
昨晚使用ChatGPT发现一直报错,出现以下报错: Hmm...something seems to have gone wrong.; 消息流中的错误; 无论怎么试都无法...
0
评论
分享
Q同学
学生
·
3月前
关注
ReSearch:通过强化学习让大模型学会在推理中搜索
摘要 当前大语言模型(LLMs)在多跳推理任务中展现出卓越表现,但如何将外部搜索与推理过程深度融合,仍是一大挑战。本文提出ReSearch框架,通过强化学习训练模型从零开始...
0
评论
分享
Q同学
学生
·
3月前
关注
TORL:工具集成强化学习,让大语言模型学会用代码解题
近年来,大语言模型(LLMs)在推理能力上取得突破,但在精确计算和复杂逻辑任务中仍受限。本文提出 TORL(Tool-Integrated Reinforcement Le...
1
评论
分享
Q同学
学生
·
3月前
关注
Qwen3开源最新Embedding模型
Qwen3-Embedding 是构建于 Qwen3 基础模型上的新一代文本嵌入与重排序模型系列,显著提升了多语言理解、代码检索与复杂指令任务中的表现。该系列模型覆盖三个参...
1
评论
分享
Q同学
学生
·
3月前
关注
仅用一条无标签数据,如何让大模型推理能力飙升?——One-shot Entropy Minimization 论文分享
导语 论文标题:One-shot Entropy Minimization 论文链接:https://arxiv.org/abs/2505.20282 1 引言 大语言模型...
1
评论
分享
Q同学
学生
·
3月前
关注
在RTX5060Ti上进行Qwen3-4B的GRPO强化微调
导语 最近赶上618活动,将家里的RTX 4060显卡升级为了RTX 5060Ti 16GB版本,显存翻了一番,可以进行一些LLM微调实验了,本篇博客记录使用unsloth...
1
评论
分享
Q同学
学生
·
4月前
关注
Qwen3技术报告笔记
昨晚Qwen3发布了完整的技术报告,介绍了最新的 Qwen3 系列模型,包含稠密架构和 MoE 架构,参数规模从 0.6B 到 235B。Qwen3 将“思考模式”(用于复...
1
评论
分享
Q同学
学生
·
4月前
关注
字节ReTool:大模型也要学会善于利用工具
尽管强化学习训练的推理模型在纯文本推理任务中表现突出,但在需要精确计算或符号操作的结构化问题上仍显不足。为此,本文提出 ReTool 框架,通过将实时代码执行与自然语言推理...
1
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
2,190
文章被阅读
387,586
掘力值
11,148
关注了
32
关注者
238
收藏集
1
关注标签
12
加入于
2021-12-01