【AI手记系列-2026/6/1】AI编程工作流、智谱CEO访谈、side命令

91 阅读10分钟

01. B站长视频收获

裸辞回国做独立游戏,花了2万8摸索出的AI编程工作流

PixPin_2026-06-01_23-26-49.png

这个视频,我反复听了至少有3遍。UP主是一名独立游戏开发者,使用AI Agent进行辅助编程。在这个视频中,UP对AI工作流的搭建,提出了一些很有价值的观点。

  1. 大型、方向明确的功能,用“文档驱动开发”。 流程是:发散需求 → 写 PRD → 让 Agent 制定 plan → review plan → 实现 → 测试迭代 → 人工 review。
  2. PRD 是整个流程的核心资产。 重点要写清楚:术语定义、用户交互方式、验收标准和边界情况。否则 AI 会按自己的理解写代码,后期修正成本很高。
  3. 小型或需求模糊的功能,用“原型驱动开发”。 先让 AI 快速做出 MVP,通过实际体验澄清需求;当功能变大、逻辑变清晰后,再回到文档驱动流程重构。
  4. AI 时代工程师的角色在上移。 人不再主要负责逐行写代码,而是负责定义方向、维护系统理解、审查架构和控制质量。
  5. 文档变成人和项目之间的重要接口。 因为 AI 可以把自然语言转换成代码,文档的重要性接近过去代码本身的重要性,尤其是核心系统、容易被自然语言描述的系统,应持续维护文档。
  6. Agent 不是完全自治的工程师。 当前阶段仍必须人工 review,尤其要关注可维护性、架构、系统边界和模块交互,不能完全放手。
  7. 实用建议:
  • 信息给得越充分,AI 产出越好。
  • 一定要用 plan 模式。
  • 让 AI 写测试,成本低收益高。
  • 把固定流程 skill 化 / 脚本化。
  • 不要过度沉迷代码细节,重点看主干架构。
  • 工具链保持轻量,不要把大量时间花在自制调度工具上。

张小珺访谈智谱CEO张鹏

PixPin_2026-06-02_07-45-57.png 智谱是来自于清华的创业团队,旗下有GLM大模型,主要从事业务是ToB、ToC,像我们公司就采购了智谱的大模型服务。张鹏给人的感觉是沉稳、务实、诚恳,典型的工程师形象。

这期视频的核心是:借智谱上市这个节点,讨论一家中国大模型公司如何从清华实验室走向 AGI 创业、商业化、开源竞争和资本市场。

  1. 智谱的底层叙事不是“上市公司”,而是“AGI 先行者” 张鹏希望智谱在 AI 历史中被记作“AGI 的先行者”或“开路的人”。上市只是长跑中的里程碑,不是终点。
  2. 智谱的起点是清华的工程转化传统 它不是从纯商业机会出发,而是从清华实验室的 Paper to Product 传统出发,把研究成果转成真实系统和产品。
  3. 技术路线从认知智能走向大模型 智谱早期做认知智能、科技情报平台 Aminer,后来 GPT-3 / ChatGPT 验证了大模型方向,智谱转向 GLM / ChatGLM,并持续押注通用模型。
  4. 智谱更偏 2B,而不是纯 C 端流量战 张鹏认为中国 C 端付费意愿弱,智谱不会把唯一赌注押在 C 端。它更重视企业客户,因为企业是生产力提升最集中的场景。
  5. 外界对智谱“to G / 项目外包”的理解过于片面 张鹏强调智谱主要服务企业客户,不是围着政府转;其核心逻辑是用大模型提升企业生产效率。
  6. 开源既是技术理想,也是战略工具 开源被视为智力平权、扩大影响力和推动生态的方式,但开源不等于免费,商业化服务仍然需要清晰边界。
  7. 不迷信暴力堆算力,重视工程优化和降本 智谱的技术路线强调算法、数据、工程效率和成本控制,而不是只靠更大算力。
  8. DeepSeek 的意义在于降本、开源和重新激活行业想象 它证明中国团队也能通过工程和算法优化改变成本结构,同时强化了开源路线的价值。
  9. AGI 的下一阶段可能来自多模态、Agent 和在线学习 访谈中反复出现的方向是:统一建模、多模态融合、在线强化学习、训练与推理一体化,以及更强泛化能力的 Agent。
  10. 上市后的真正挑战是保持长期主义 成为公众公司后,智谱要面对资本市场压力,但张鹏强调不能只赚钱、没有技术产出;否则不是他想要的公司。

02. 本周工作沉淀

把AI嵌入到项目全流程

这周自己一直在思索一件事——如何真正地做到AI原生开发,将AI嵌入到项目全流程中,而不仅仅是作为问答工具、代码生成器?如何形成可复用、可衡量的工程化能力?

当我们谈论 AI落地 时,一定不只是谈论“会不会用工具”,而在于“能不能形成规范和闭环”。如果团队成员只是用AI做问答、写小函数,价值很有限,而且上限很低。

更有效的方式,是围绕真实研发场景建设 Skill、模板和 checklist,可以用历史的文档例如需求评审报告、软件设计方案作为模板喂给 AI,并且持续迭代。对于团队中成员的AI掌握程度参差不齐的情况,可以从 “工具绑定 + 行为量化 + 正向激励” 三方面推进。

同时,AI提效必须被量化,否则它很容易变成一句空话。例如我们要评估技术团队在“需求吞吐量”上的提升。但不同版本、不同需求的实现难度是不同的,横向如何进行比较?一个可行的简化模型,是把需求按低、中、高分为 1、2、3 三档复杂度,再统计 单位复杂度交付周期。这样即使不同版本的需求难度不同,也可以通过 总复杂度/交付周期 比较需求吞吐量变化,判断 AI 是否真正提升了团队交付能力。

最终,作为研发负责人的核心竞争力,应当从“完成业务和UI开发”,升级为“设计AI驱动的研发流程,并用数据证明结果”。把 “引入 AI” 升级为 “构建 AI 原生开发闭环”,用 “场景 + 动作 + 数据 + 业务结果” 的结构包装。

03. 个人实践与思考

vibe coding 与 AI 辅助编程

此处的 Vibe Coding 指纯靠对话的氛围式编程,它的爽点在于将程序员从逐行手敲代码的枯燥工作中解放出来,成为AI这个工具人的监工。AI编码的速度比人类快了不止一个量级,会让人有种“生产力飞速提升”的错觉。

同时,纯VibeCoding也必然带来不小的风险。这降低了工程师在编码时“思考”的比例,提升了“判断”的比例。AI编写的代码在逻辑上往往是自洽的,但它是否考虑到了业务中的边界场景?对于当前项目的独特性有没有进行适配?AI的依据往往是大众的、普适的知识,但在你的项目里,一定存在一些由于版本兼容、系统适配、以及一致性等原因,所进行的独特设计,对于这部分特有逻辑,AI可能是欠考虑的。

更重要的是,AI是无法为所编写的代码承担责任的,最终担责的那个人一定是代码提交者。出了bug,把日志丢给AI也许能解决,但一旦它解决不了,加上对于AI生成的代码,人根本不熟悉,就很容易陷入“方向不对,越改越错”的死局。

所以现在,我更多的是“AI辅助编程”,而非“纯氛围编程”。当准备完成一个需求开发时,先让AI给出执行计划,类似 /plan 模式,由人工仔细审查该计划,结合对项目、模块的历史经验,思考是否覆盖到边界场景,对于策划中的细节有没有遗漏等。通常至少经过一轮对计划的优化后,才执行开发。计划可以看成一种约束条件,因此这是 SDD 思想的一种应用。

除了 SDD,我们知道还有 TDD 也是AI编程的一个趋势,对于核心的业务逻辑和计算场景,这是非常重要的。先让AI设计出测试用例,随后在触及相关逻辑修改时,跑用例保证修改的正确性。

当然,对于小的实验性的工具项目,使用VibeCoding并没有太大的问题。但对于涉及到大量用户的生产级应用,开发者必须对AI写的每一行代码负责。这里不是说要事无巨细、完全理解AI写的每一个函数,而是要搞清楚AI实现需求的逻辑,弄懂其中的数据流、控制流,当出现问题时能够快速排查和定位。

现阶段的AI就好像自动驾驶,还远远没达到脱离人类、全自主运行的阶段,对结果负责的只有开发者本身。去利用AI能提效的部分,引导AI写出正确、全面、可维护的代码,同时规避AI可能带来的风险。

codex 的 /side 命令

通过 /side 启动旁路任务,可以继承当前上下文开启临时提问,在主对话耗时任务时与AI交流。临时对话销毁后,自动回到主对话,不污染主对话的上下文。

Claude Code 也有一个功能相同的指令,/btw(by the way)。

举一个实际应用过程的场景,在AI辅助编程的过程中,发现某个依赖服务(例如 playwright)不可用,此时可以通过 /side 来拉起一个子对话,在其中解决环境问题后,Ctrl+C 返回主对话,既能保持主对话的整洁,又避免污染上下文。

codex-session 书签管理工具

这是为了解决 codex cli 对话管理机制而做的一个小工具,由于codex自带的对话管理机制过于简陋,退出会话并关机后,重新开机时需要进入到原会话目录,执行 codex resume 才能继续工作。

在工作目录很多时,一旦忘记了上一个操作的目录是哪里,就很容易丢失掉未完成的工作会话。

因此我制作了一个名为 codex-session 的小管理工具,将它安装在 ~/.local/bin/ 目录下,支持如下功能:

命令作用
savesave or update a bookmark for the current Codex session
listlist saved bookmarks
searchsearch saved bookmarks
resumeresume a saved bookmark by name, keyword, or session id
renamerename a bookmark
deletedelete a bookmark without deleting the Codex session

例如,当某天工作完成,我需要关机时。在关机之前,可以在CLI中直接告诉AI:codex-session save 智能手电筒需求开发

在下次开机后,无论处在哪个目录下,都可以执行 codex-session list 来查看书签列表,随后通过 codex-session resume 智能手电筒 来自动切换到原目录,并恢复 Codex 会话。