在这一波 AI 浪潮中,图像生成和对话生成 AI 同时爆火。这两种应用都是交互式的,虽然在技术上相似点不多,但是似乎这两种 AI 同时爆火绝非巧合。
多样性确实吸引人
生成式 AI 依赖于随机数生成来提高质量。人们似乎更喜欢这种富有多样性的结果,这也是赌博和手游令人上瘾的原因。
从某种程度上说,网络搜索是第一个广受欢迎的 AI 交互方式。谷歌并非通过提供完美或确定性的结果击败其他搜索引擎,而是更擅长在第一页上给我们提供一系列很好的结果,谷歌有一个“手气不错”按钮,用来展示他们的首选结果很多时候是非常好的,但实际上这只是一个噱头。网络搜索也是第一个让你用人类语言而非程序设计语言输入并获得良好结果的热门应用。
图像生成器的工作方式与网络搜索相似,只是与网络搜索相比,它们非常慢且非常昂贵,因此每次提供的结果较少。和 GPT4 聊天让我想起了使用 300 波特的调制解调器拨号上网的日子。我们可以假设它们会有所改进,而且有一天很快我们会像回顾拨号上网的老一辈那样回顾今天的技术。
但如果你想踏入同一条河流
生成式AI对于全自动化来说非常糟糕。一个典型的自动化例子是工厂流水线,你希望它更快、更可靠以降低成本。在工厂中,随机变化是不好的。负责流水线的工程师会寻找变化的原因并消除它们。(这是在流水线上工作通常不好玩的一个原因。)
此外,生成式 AI 非常昂贵,反复运行会浪费金钱和电力。
相比之下,传统软件通常更”擅长“重复运行。希望反复执行某项操作的程序员会编写脚本并根据需要运行。当有变化时,它是受到严格控制的,运行脚本的成本要低得多。
所以
许多程序员已经成功地使用了 Copilot 和 ChatGPT。我只稍微尝试了一下,但对我来说,使用 GPT4 编写一段代码就像给汽车司机指路一样。有时候司机知道一个你不知道的捷径,就能节省时间;而有时候司机会误解你的意思而走错路,但你仍然可以告诉他走另一条路。(幸运的是,用 ChatGPT 编写脚本比开车更安全,因为它是一个回合制的游戏。)
一旦你完成了一个脚本,你可以反复使用它,它会变得快速且可靠。直到它出问题,然后也许 AI 可以帮你修复它?
许多公司正在围绕 AI 聊天开发软件,但有时他们似乎对其优势感到困惑。我希望并期待将有成功的设计,鼓励人与基于 AI 的工具之间的互动合作。为了安全起见,AI 不会在无人看管的情况下运行。相反,将有可视化工具让你看到 AI 正在做什么,逐步了解整个过程,以便人们了解并掌控过程并进行纠正。程序员会发现这很熟悉,就像使用调试器一样。最后当这个脚本写完时,人和 AI 就都不需要去改变它了。