科研分享

科研分享

科研分享

分析科研过程中学习到的知识

暂无订阅共7篇文章创建于2026-02-27

你的 AI Agent 正在"浪费"每一次对话：OpenClaw-RL 如何让 Agent 越用越聪明

你的 AI Agent 正在"浪费"每一次对话：OpenClaw-RL 如何让 Agent 越用越聪明每天，全球数以亿计的 AI Agent 正在与用户进行交互。它们回答问题、执行代码、操作 GU

19天前
88
点赞
评论

你的 AI Agent 正在"浪费"每一次对话：OpenClaw-RL 如何让 Agent 越用越聪明

不需要标准答案，大模型也能自我进化？清华提出 TTRL，用"投票"替代标注做强化学习

不需要标准答案，大模型也能自我进化？清华提出 TTRL，用"投票"替代标注做强化学习一个反直觉的发现强化学习（RL）正在成为大语言模型（LLM）推理能力提升的核心引擎。从 DeepSeek-R1

23天前
49
点赞
评论

不需要标准答案，大模型也能自我进化？清华提出 TTRL，用"投票"替代标注做强化学习

如何训练你的"潜变量"？Google DeepMind 提出 Unified Latents，用扩散模型同时编码、正则化和生成

如何训练你的"潜变量"？Google DeepMind 提出 Unified Latents，用扩散模型同时编码、正则化和生成 Key Takeaways / 核心要点 Unified Latents

1月前
24
点赞
评论

如何训练你的"潜变量"？Google DeepMind 提出 Unified Latents，用扩散模型同时编码、正则化和生成

智谱AI GLM-5 技术报告全面解读

智谱AI GLM-5 技术报告全面解读为什么现在要关心这个方向？ 2026年2月，智谱AI联合清华大学发布了GLM-5——一个744B参数的开源基座模型。这不只是又一次"刷榜"，而是一次范式转变的宣

1月前
502
点赞
评论

智谱AI GLM-5 技术报告全面解读

当 AI 开始"翻书"：一文读懂检索增强生成（RAG）的前世今生与实战指南

当 AI 开始"翻书"：一文读懂检索增强生成（RAG）的前世今生与实战指南开篇：AI 很强，但它也会"胡说八道" 你一定用过 ChatGPT、Copilot 或者 Stable Diffusion。

1月前
95
点赞
评论

当 AI 开始"翻书"：一文读懂检索增强生成（RAG）的前世今生与实战指南

一文读懂MOE：大模型背后的"专家分工"智慧

一文读懂MOE：大模型背后的"专家分工"智慧重点内容 MoE（混合专家模型）是当前大模型扩展的核心技术之一，DeepSeek、Mixtral、GPT-4 等明星模型都在用核心思想：不是所有参数都

1月前
159
点赞
评论

一文读懂MOE：大模型背后的"专家分工"智慧

混合专家模型 (MoE) 详解

混合专家模型 (MoE) 详解随着 Mixtral 8x7B (announcement, model card) 的推出，一种称为混合专家模型 (Mixed Expert Models，简称 Mo

1月前
44
点赞
评论

混合专家模型 (MoE) 详解