我创建了一个全 AI 员工的一人公司

0 阅读7分钟

大家好,我是 Sunday。

现在,用 AI 写代码,已经不算什么新鲜事了。写个组件、补个函数、改个 Bug,几句话交给模型就能搞定。

但是,大家有没有想过一个问题:如果我不只是用一个 AI,而是用一群 AI,会发生什么?

我们现在用 AI,本质上只是把它当成“高级工具”,即:我遇到问题 → 我问 AI → 它给我答案。

那么如果我们把脑洞放大一点呢?

既然我可以调用一个 AI,那是不是也可以 同时调用多个 AI ?既然 AI 可以写代码,那它是不是也可以完成:产品经理、设计师、测试、运维,甚至是 财务、人事 的工作?

换句话说: 我能不能,用一群 AI,组建一家“只有我一个人类员工”的公司?

多个 AI,各自承担不同角色:

  • 产品负责拆需求:告诉产品我的需求,然后产品帮我把需求拆解成可以具体执行的步骤
  • 开发负责编码:把具体的步骤告诉开发,开发负责把整个功能落地
  • 测试负责验收:开发的代码,交给测试进行验收。验收失败则重新打回开发,开发负责修改 BUG
  • 运维负责部署:最终完成的项目,运维负责部署上线,构建整个自动化部署的流程
  • 财务负责算账:每天的 token 支出 和 营收,并给出更省钱的财务方案
  • 人事负责管理:哪个 AI 员工“不合格”,人事负责把它“开掉”,并根据我的需求重新“招聘(生成)”新的 AI 员工

并且,我还希望它们之间可以独立思考,互相沟通,而我只负责:下目标、做决策。

如果这件事真的可行,那意味着什么?意味着一个人,或许可能真的可以撬动一整家公司级别的生产力。

说干就干。

AI 选择

市面上的 AI 模型已经非常多了:Claude、GPT Coder、Gemini、GLM、DeepSeek。。。有的贵,有的便宜,有的擅长推理,有的擅长编码。

最理想的状态其实很明确:

  • 贵的 AI,承担复杂任务:产品设计、系统架构、核心编码
  • 便宜的 AI,承担简单任务:统计、对账、流程、输出财务报表

只要这些 AI 之间可以互相沟通,以上这些都不是问题。

但是,Sunday 在经过一系列的测试之后,发现了一个很残酷的事,就是 不同模型的 AI 之间完全无法沟通。特别是不同厂商的 AI,每一个都被作为了独立的个体。虽然可以通过“协调者”方式强行拼接,但是实现复杂,并且效果也不理想。

额。。。好像这个一人公司的梦想就直接破灭了...

不行,不能那么容易放弃。

所以,在第一阶段,我只能选择一个更“粗暴但稳定”的方案:全部使用 Claude。

因为 Claude 提供了一个非常关键的工具:Claude Code:一个运行在纯终端里的 AI 编码智能体。我们只需要打开终端就可以直接通过语言对话的方式调用 AI 模型。

而接下来,我要做的事情是:用 Claude Code,一步步搭出一家“AI 员工公司”的雏形。

启动多个 AI 终端

一个终端窗口作为一个员工,如果我们想要多个员工那么就只需要启动多个终端就可以。然后我们要给他们赋予角色。一开始,我们可以先从最小可行方案开始:

我们先制定两个角色,他们分别是:

  • 张三:产品经理
  • 李四:程序员

然后,就出现了 大型翻车现场....

在我尝试给 Claude 提示词,让他变成 张三 的时候。Claude 给我的回复是:我是 Claude,我不是张三....

不是,咱说好的玩角色扮演呢...你就这么不配合的吗?

因为在我的设想里,这一步应该是最简单、最“理所当然”的:起个名字、设个背景、分配个角色。然后 AI 就会自动进入对应的工作模式。

结果现实就是这么现实:“我能帮你完成工作,但是我就不承认我是张三,我就是 Claude

这不是能力问题,这赤裸裸的就是个 态度问题 啊! 看来 AI 也不想当牛马啊。。。

没办法,我只能尝试修改下提示词:

好的,产品经理已就位。然后我们可以从一个小的 todolist 的需求开始:

现在我们已经有了一个 todolist 的需求文档了。接下来最好的方案就是 产品经理的 AI 可以直接通知 程序员 AI,完成代码实现。

但是,可惜 不同窗口之间 AI 无法直接通讯。所以,我就必须要承担起这个通讯员的角色。

最终实现的效果如下:

整个功能完善、可用。并且还提供了 主题变化 的功能。。。

反思

可是如果我们仔细去分析上面整个流程,我们可以发现:这个流程远没有我们想象的那么顺畅。甚至有点 多此一举

因为以上这些需求完全可以在一个 Claude code 中完成,没有必要进行这样的划分。甚至可以说:在任务简单时,多 AI 协作不仅没有提升效率,反而增加了沟通成本。

而这样的一种调度+协作的方式,如果任务变得复杂了,恐怕 AI 没有乱呢,我们自己就已经先手忙脚乱了。

这让我开始怀疑:最初设想的这种全 AI 员工的方式,会不会从一开始,就是错的?

但是,当我仔细思考过之后,我发现问题不在于“多角色”这个想法本身,而在于:当前这种“多终端 + 人工调度”的协作方式,本质上是一个非常低效的协作模型。

如果我们换一个角度,从“协作工具”入手,情况可能会完全不同。

这时,我注意到了一个开源项目:vibekanban

它提供了一种非常典型的多人协作看板模式,和我们熟悉的 Teambition、Jira、Trello 几乎一致,包含了:任务可视化、状态流转清晰、每个角色只关注自己的列

teambition 的多人协作看板

vibekanban 的协作看板

通过 vibekanban 这种工具,我们至少可以做到:多任务并行更清晰、角色边界更稳定、协作过程可追踪、可回溯。

但即便如此,我很快又意识到一个更现实的问题:这,依然离“全 AI 员工的一人公司”,依旧差得很远。

全 AI 员工的难点在哪里?

根据 Sunday 的实验,其实我们可以发现,全 AI 员工的最大难点就是 如何高效的完成 AI 之间的自动协作

更具体一点说,核心难点只有一个:如何让多个 AI,在几乎没有人工干预的情况下,自动完成“上下文传递 + 状态对齐 + 任务接力”?

那么这个功能可以实现吗?

答案是 绝对可以

学习过咱们的 商业级 AI 课程 的同学都知道,在 AI 的持续对话中,我们可以通过记录上下文的方式完成跨角色的连续对话

那么同样的道理,如果我们可以记录不同 AI 沟通上下文的 关键内容,然后通过上述的同样逻辑呼叫下一个 AI(让代码通过指令自动传输关键上下文,并调起 AI 服务),那么全 AI 员工的功能就可以实现。只不过在这样的完美的流转过程中,我们还需要做很多的努力才可以。

总结

这一通折腾下来,收获还是很明显的。三个关键:

  1. 单模型,已经足够强
  2. 多模型,真正难的是系统设计
  3. “全 AI 员工”,本质是一个 调度系统 + 状态系统 + 协作协议 的问题

而这,也意味着:下一阶段的探索重点,已经不再是“哪个模型更强”,而是:如何设计一套真正可自动运行的“AI 组织系统”。