【AI手记系列-2026/6/1】AI编程工作流、智谱CEO访谈、side命令B站裸辞回国做独立游戏，花了2万8摸索出

01. B站长视频收获

裸辞回国做独立游戏，花了2万8摸索出的AI编程工作流

这个视频，我反复听了至少有3遍。UP主是一名独立游戏开发者，使用AI Agent进行辅助编程。在这个视频中，UP对AI工作流的搭建，提出了一些很有价值的观点。

大型、方向明确的功能，用“文档驱动开发”。 流程是：发散需求 → 写 PRD → 让 Agent 制定 plan → review plan → 实现 → 测试迭代 → 人工 review。
PRD 是整个流程的核心资产。 重点要写清楚：术语定义、用户交互方式、验收标准和边界情况。否则 AI 会按自己的理解写代码，后期修正成本很高。
小型或需求模糊的功能，用“原型驱动开发”。 先让 AI 快速做出 MVP，通过实际体验澄清需求；当功能变大、逻辑变清晰后，再回到文档驱动流程重构。
AI 时代工程师的角色在上移。 人不再主要负责逐行写代码，而是负责定义方向、维护系统理解、审查架构和控制质量。
文档变成人和项目之间的重要接口。 因为 AI 可以把自然语言转换成代码，文档的重要性接近过去代码本身的重要性，尤其是核心系统、容易被自然语言描述的系统，应持续维护文档。
Agent 不是完全自治的工程师。 当前阶段仍必须人工 review，尤其要关注可维护性、架构、系统边界和模块交互，不能完全放手。
实用建议：

信息给得越充分，AI 产出越好。
一定要用 plan 模式。
让 AI 写测试，成本低收益高。
把固定流程 skill 化 / 脚本化。
不要过度沉迷代码细节，重点看主干架构。
工具链保持轻量，不要把大量时间花在自制调度工具上。

张小珺访谈智谱CEO张鹏

智谱是来自于清华的创业团队，旗下有GLM大模型，主要从事业务是ToB、ToC，像我们公司就采购了智谱的大模型服务。张鹏给人的感觉是沉稳、务实、诚恳，典型的工程师形象。

这期视频的核心是：借智谱上市这个节点，讨论一家中国大模型公司如何从清华实验室走向 AGI 创业、商业化、开源竞争和资本市场。

智谱的底层叙事不是“上市公司”，而是“AGI 先行者” 张鹏希望智谱在 AI 历史中被记作“AGI 的先行者”或“开路的人”。上市只是长跑中的里程碑，不是终点。
智谱的起点是清华的工程转化传统 它不是从纯商业机会出发，而是从清华实验室的 Paper to Product 传统出发，把研究成果转成真实系统和产品。
技术路线从认知智能走向大模型 智谱早期做认知智能、科技情报平台 Aminer，后来 GPT-3 / ChatGPT 验证了大模型方向，智谱转向 GLM / ChatGLM，并持续押注通用模型。
智谱更偏 2B，而不是纯 C 端流量战 张鹏认为中国 C 端付费意愿弱，智谱不会把唯一赌注押在 C 端。它更重视企业客户，因为企业是生产力提升最集中的场景。
外界对智谱“to G / 项目外包”的理解过于片面 张鹏强调智谱主要服务企业客户，不是围着政府转；其核心逻辑是用大模型提升企业生产效率。
开源既是技术理想，也是战略工具 开源被视为智力平权、扩大影响力和推动生态的方式，但开源不等于免费，商业化服务仍然需要清晰边界。
不迷信暴力堆算力，重视工程优化和降本 智谱的技术路线强调算法、数据、工程效率和成本控制，而不是只靠更大算力。
DeepSeek 的意义在于降本、开源和重新激活行业想象 它证明中国团队也能通过工程和算法优化改变成本结构，同时强化了开源路线的价值。
AGI 的下一阶段可能来自多模态、Agent 和在线学习 访谈中反复出现的方向是：统一建模、多模态融合、在线强化学习、训练与推理一体化，以及更强泛化能力的 Agent。
上市后的真正挑战是保持长期主义 成为公众公司后，智谱要面对资本市场压力，但张鹏强调不能只赚钱、没有技术产出；否则不是他想要的公司。

02. 本周工作沉淀

把AI嵌入到项目全流程

这周自己一直在思索一件事——如何真正地做到AI原生开发，将AI嵌入到项目全流程中，而不仅仅是作为问答工具、代码生成器？如何形成可复用、可衡量的工程化能力？

当我们谈论 AI落地 时，一定不只是谈论“会不会用工具”，而在于“能不能形成规范和闭环”。如果团队成员只是用AI做问答、写小函数，价值很有限，而且上限很低。

更有效的方式，是围绕真实研发场景建设 Skill、模板和 checklist，可以用历史的文档例如需求评审报告、软件设计方案作为模板喂给 AI，并且持续迭代。对于团队中成员的AI掌握程度参差不齐的情况，可以从 “工具绑定 + 行为量化 + 正向激励” 三方面推进。

同时，AI提效必须被量化，否则它很容易变成一句空话。例如我们要评估技术团队在“需求吞吐量”上的提升。但不同版本、不同需求的实现难度是不同的，横向如何进行比较？一个可行的简化模型，是把需求按低、中、高分为 1、2、3 三档复杂度，再统计 单位复杂度交付周期。这样即使不同版本的需求难度不同，也可以通过 总复杂度/交付周期 比较需求吞吐量变化，判断 AI 是否真正提升了团队交付能力。

最终，作为研发负责人的核心竞争力，应当从“完成业务和UI开发”，升级为“设计AI驱动的研发流程，并用数据证明结果”。把 “引入 AI” 升级为 “构建 AI 原生开发闭环”，用 “场景 + 动作 + 数据 + 业务结果” 的结构包装。

03. 个人实践与思考

vibe coding 与 AI 辅助编程

此处的 Vibe Coding 指纯靠对话的氛围式编程，它的爽点在于将程序员从逐行手敲代码的枯燥工作中解放出来，成为AI这个工具人的监工。AI编码的速度比人类快了不止一个量级，会让人有种“生产力飞速提升”的错觉。

同时，纯VibeCoding也必然带来不小的风险。这降低了工程师在编码时“思考”的比例，提升了“判断”的比例。AI编写的代码在逻辑上往往是自洽的，但它是否考虑到了业务中的边界场景？对于当前项目的独特性有没有进行适配？AI的依据往往是大众的、普适的知识，但在你的项目里，一定存在一些由于版本兼容、系统适配、以及一致性等原因，所进行的独特设计，对于这部分特有逻辑，AI可能是欠考虑的。

更重要的是，AI是无法为所编写的代码承担责任的，最终担责的那个人一定是代码提交者。出了bug，把日志丢给AI也许能解决，但一旦它解决不了，加上对于AI生成的代码，人根本不熟悉，就很容易陷入“方向不对，越改越错”的死局。

所以现在，我更多的是“AI辅助编程”，而非“纯氛围编程”。当准备完成一个需求开发时，先让AI给出执行计划，类似 /plan 模式，由人工仔细审查该计划，结合对项目、模块的历史经验，思考是否覆盖到边界场景，对于策划中的细节有没有遗漏等。通常至少经过一轮对计划的优化后，才执行开发。计划可以看成一种约束条件，因此这是 SDD 思想的一种应用。

除了 SDD，我们知道还有 TDD 也是AI编程的一个趋势，对于核心的业务逻辑和计算场景，这是非常重要的。先让AI设计出测试用例，随后在触及相关逻辑修改时，跑用例保证修改的正确性。

当然，对于小的实验性的工具项目，使用VibeCoding并没有太大的问题。但对于涉及到大量用户的生产级应用，开发者必须对AI写的每一行代码负责。这里不是说要事无巨细、完全理解AI写的每一个函数，而是要搞清楚AI实现需求的逻辑，弄懂其中的数据流、控制流，当出现问题时能够快速排查和定位。

现阶段的AI就好像自动驾驶，还远远没达到脱离人类、全自主运行的阶段，对结果负责的只有开发者本身。去利用AI能提效的部分，引导AI写出正确、全面、可维护的代码，同时规避AI可能带来的风险。

codex 的 /side 命令

通过 /side 启动旁路任务，可以继承当前上下文开启临时提问，在主对话耗时任务时与AI交流。临时对话销毁后，自动回到主对话，不污染主对话的上下文。

Claude Code 也有一个功能相同的指令，/btw（by the way）。

举一个实际应用过程的场景，在AI辅助编程的过程中，发现某个依赖服务（例如 playwright）不可用，此时可以通过 /side 来拉起一个子对话，在其中解决环境问题后，Ctrl+C 返回主对话，既能保持主对话的整洁，又避免污染上下文。

codex-session 书签管理工具

这是为了解决 codex cli 对话管理机制而做的一个小工具，由于codex自带的对话管理机制过于简陋，退出会话并关机后，重新开机时需要进入到原会话目录，执行 codex resume 才能继续工作。

在工作目录很多时，一旦忘记了上一个操作的目录是哪里，就很容易丢失掉未完成的工作会话。

因此我制作了一个名为 codex-session 的小管理工具，将它安装在 ~/.local/bin/ 目录下，支持如下功能：

命令	作用
save	save or update a bookmark for the current Codex session
list	list saved bookmarks
search	search saved bookmarks
resume	resume a saved bookmark by name, keyword, or session id
rename	rename a bookmark
delete	delete a bookmark without deleting the Codex session

例如，当某天工作完成，我需要关机时。在关机之前，可以在CLI中直接告诉AI：codex-session save 智能手电筒需求开发。

在下次开机后，无论处在哪个目录下，都可以执行 codex-session list 来查看书签列表，随后通过 codex-session resume 智能手电筒 来自动切换到原目录，并恢复 Codex 会话。