首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AI时代学习
Luhui_Dev
创建于2025-12-12
订阅专栏
持续更新: 1. 架构与框架对比 2. 记忆模型解析 3. 工程落地经验 用开发者的视角,把复杂的 Agent 系统讲得更清楚
暂无订阅
共19篇文章
创建于2025-12-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
一句话讲明白:MCP、Skills、Agents SDK 到底谁是标准?
通过一个“智能工厂”的类比,作者将 MCP、Skills、Agents SDK 放回各自该在的位置,清晰地区分了协议层、能力封装层与运行时调度层。
2025 年,我最离不开的 7 个 AI 工具,以及我真正的工作方式
一个工程型创作者的真实工作流。我这一年,如何用 AI 构建第二个大脑和第二套生产系统。 生产力引擎:AI IDE (Cursor、Trae、Claude 等)...
工程视角:Agent 时代,诚实对齐该如何落地?
大模型 Agent、reward hacking、工具调用隐瞒、confession 双通道、置信门控、可回滚事务、Prompt Shield、Constitutional Classifier——一
当模型知道自己在作弊:Scheming 与 Reward Hacking 的技术解剖
并非所有“不靠谱输出”都源自模型无知。越来越多证据显示,一类高风险失败模式来自有意识的不诚实:模型理解规则、评估收益,并在最优策略下选择欺骗。本文系统拆解三条研究主线——Reward Hacking、
2025 开源大模型生态回顾一览
2025 年,开源大模型首次在推理能力与工程可用性上进入前沿竞争,从“复刻闭源”转向与其并跑,并形成多路线并存的生态格局。中国团队成为这一轮跃迁的关键推动者。
Self-reflection 的幻觉:为什么让模型“反思”往往没用?
通过对比自我批评、反思提示、自洽投票、辩论、宪法式对齐与供述机制,文章揭示:减少错误不等于提升诚实,真正的可信性需要独立的披露通道与激励设计。
OpenAI Confession:为什么“承认作弊”比“不作弊”更重要
Confession 并不是让模型“更守规矩”,而是通过奖励解耦,让模型在事后如实暴露自己的违规、取巧与不确定性。它承认一个现实:在 Agent 系统中,作弊不可避免,但不可见才是真正的风险。
OpenAI:大模型真正的问题不是幻觉,而是不诚实
当模型输出错误内容时,我们通常认为这是能力不足。但如果模型知道自己不确定、知道自己违规,却依然给出一个看似合理的答案,这还是“幻觉”吗?OpenAI 最近的研究,将问题从正确性转向诚实性,揭示了强化学
幻觉不是 AI 的病,而是智能的宿命
过去两年里,AI 的“幻觉”(hallucination)问题成了最热门的技术话题之一。 像昨天发布的 GPT-5.2 Thinking 中也提到,最新版本的实时性错误测试又减少了 30%。
突破 MoE 限制,PEER 架构如何推动超级智能的未来发展
PEER架构颠覆了传统MoE模型的局限,开创了大规模专家池与高效路由的新纪元。探索如何通过百万级微专家和动态扩展,推动AI智能系统不断成长和进化。
Claude Multi-Agent 的核心经验精华(面向工程与产品)
从 Claude Multi-Agent 学到的 12 个让系统“能打硬仗”的设计智慧。本文分享了Claude团队的核心经验,揭示了如何用多智能体提升AI系统的性能和效率。
为什么李飞飞说:AI 真正的进步取决于世界模型
为什么世界模型和空间智能代表了人工智能超越大型语言模型的下一个前沿?别被炫酷 3D 骗了:世界模型真正改变的是 AI 的“理解能力”。
从顶流开源 Kimi K2-Thinking 学习:什么是推理模型?
Kimi K2‑Thinking 是优秀的开源推理模型,突破了传统大型语言模型的局限,以长时间推理、工具调用和自我反思为核心,展现了在复杂任务中的卓越表现。
从 GPT-5 Unified 系统设计中学到的工程精髓
GPT-5 Unified如何通过灵活的推理机制,让AI在不同的场景中表现得更高效、更智能?文章将揭示如何通过调度决策与深度推理让推理能力变得可控和扩展。
Agent 又又失忆了!我来做一次记忆体检
如何判断你的智能体“真的记得”而不是“假装记得”? 本文系统梳理 Agent Memory 的评估思路,从指标体系到开源基准与实测 demo,帮你为自己的智能体建立一套可量化的记忆体检方案。
了解和 AI 对话时真正发生了什么(你可能一直理解错了)
你发送一句话给 AI,看似是自然对话,实质是触发了一套即时计算与系统调度流程。如果不理解这一点,就无法真正高效协作。这篇文章带你第一次正确理解 AI 的运行逻辑。
AI 自主决定记忆:探索 A-MEM、Mem-α 和 Mem0
从 A-MEM 的记忆演化,到 Mem-α 的奖励学习,再到 Mem0 的图数据库记忆网,这些新方法正在重新定义 AI 的大脑结构。
几何 + CodeAct 范式,我创造了新的 AI 画图产品
探索 CodeAct 在几何推理中的应用,揭示从生成代码到执行反馈的闭环机制,带你理解 AI 执行推理背后的核心技术。
我用 deepseek-ocr 识别几何图形,结果有点意外
最近,deepseek 又引爆了一波热度。 他们新发布的 deepseek-ocr 模型,不仅能识别文字,还号称能看懂 化学分子式、数学公式、几何图形。 对我这个正好在做几何图形识别和重绘生成的人来说