三级AI协作：开发者的理想境界文章探讨AI委托的五个级别，强调三级AI协作为开发者保留架构监督又能代理繁重工作的“黄金点

文章探讨AI委托的五个级别，强调三级AI协作为开发者保留架构监督又能代理繁重工作的“黄金点”，并提出根据经验选择级别、批判AI代码、利用上下文窗口和AI测试的重要性。

译自：Level 3 AI Collaboration: The Sweet Spot for Developers

作者：Jennifer Riggins

这节选自《企业级AI：制定和扩展AI战略的行动指南》一书的第五章，该书由著名科技记者Jennifer Riggins撰写，并由Red Hat和Intel赞助。

从采用“双速”AI投资模式的优势到衡量AI的实际影响，这本免费书籍现已开放下载，它帮助企业领导者制定AI战略，以实现生产力提升，解决以前不可能解决的问题，并获得真正的竞争优势。

AI究竟应该掌管多少？

这在未来一两年内可能会发生巨大变化，但就目前而言，你的企业必须在组织层面、用例层面和团队层面决定你想赋予AI多少自主权。生成式AI（GenAI）仍然给用户留下了大量的控制权——除了面向公众的聊天机器人——但当你进入代码代理甚至代理AI集群时，这种情况就会改变。

“两个极端是：让AI完成所有事情，[或者]让所有事情都手动完成，”软件工程师兼技术负责人Peter Szel说。“但在中间有多个层次，例如，我定义架构，我定义我想要遵循的模式和实践，我创建计划，”而AI则根据这些进行操作。

Szel已经确定了AI委托的五个级别，旨在帮助企业摆脱“AI与否”的二元选择：

他指出，前两个级别速度不快，但你的团队保留了架构监督权。后两个级别速度确实更快，但即使是工程师也不太可能知道实现细节，这使得发现问题变得更加困难。

Szel认为，级别3是“黄金点”，在此级别上，开发者保留了架构监督权，但将繁重的工作委托出去。

一切也取决于工程师的经验。初级到中级开发者必须优化学习，应避免级别5，而专注于级别1和2。更重要的是养成“严厉批判”AI生成代码的习惯：

级别4与规范驱动的AI开发不同，后者将规范作为单一事实来源，AI代理执行。Szel认为，规范驱动的开发剥夺了工程的创造性工作。

“只根据规范工作，让代理生成代码，这对我来说听起来很糟糕，”他说。“尽管它可能有效，但我真的不想每天花八个小时在规范上。”

此外，他认为，规范驱动的开发将要求开发者不仅维护更多的代码，还需要维护更多的规范。

确保你的工程师和数据科学家为开发者精心策划上下文窗口。Szel说，这包括你正在使用的代码库或代码文件，以及编码和架构指南——任何你需要大型语言模型（LLM）在分配任务时注意到的信息。

他警告说，如果工程师将上下文窗口留空，LLM肯定会产生幻觉。但如果上下文窗口过于混乱，LLM将难以弄清楚该做什么。

然后，他继续说，让编码代理通过尝试自己运行代码来测试其结果。

Szel“要求代理首先创建自动化测试，这是我在它们开始之前会审查的东西。”

他表示，这提供了几个优势，因为“如果它们能编写出正确的测试，这意味着它们至少理解了正在解决的问题，然后它们就可以继续实施。然后，在它们实施新功能或修复bug之后，它们可以自己运行测试，检查它们是否真的修复了bug或实施了功能。”