AI大战:GPT-4与文心一言比拼!

852 阅读4分钟

最近,OpenAI 发布了最新一代自然语言处理模型 GPT-4,刷屏了整个科技圈。与此同时,百度也推出了自己的 AI 模型——文心一言,被认为是中国版 GPT-4。那么,这两个模型到底有何异同,百度的未来在哪里呢?

image.png

多模态能力

多模态能力指模型可以接受图像输入并理解图像内容,并且可接受的文字输入长度也增加到3.2万个字符。在此方面,GPT-4 取得了非常不错的成绩,可以应用于模拟律师考试等领域。此外,GPT-4 还可以解释表情包、梗图,能够按顺序描述出每一格的内容,并总结出笑点。而文心一言也具备了类似的功能,可以进行多模态生成,例如为即将到来的2023世界智能交通大会创作海报,并且支持文字转视频,文字转语音能力。

数理逻辑推算

GPT-4 可以理解图表中数据的含义,并做进一步计算。此外,GPT-4 还可以给代码修 Bug。出现问题时,只需要把2.4万字的程序文档一股脑扔给 GPT-4,就可以在几秒钟内瞬间得到解决办法。而文心一言在数理逻辑推算方面还没有展示出明显优势。

编程方面

GPT-4 可以接收程序文档并对代码进行修 Bug,还可以进行代码生成。文心一言目前还没有展示出明显的编程能力,这点与 GPT-4 有所差距。

拟人化

GPT-4 还开放了一个使用功能,允许修改“系统提示”,使其感觉更像真人一样。这使得 GPT-4 更具有互动性,而且可以扮演苏格拉底等不同角色。文心一言也具有类似的功能,可以进行对话增强,提高机器人的互动性。

中文理解

在中文理解方面,文心一言具有得天独厚的优势。在百度内部已经接入百度搜索、小度和自动驾驶 Apollo 等产品,外部包括爱奇艺等 650 家公司也已经接入。文心一言对中国文化的了解,理应超出任何一个预训练大模型。为了证明这一点,李彦宏曾输入了一个问题:“洛阳纸贵。到底有多贵?”文心一言不仅展现了历史渊源,还介绍了这个成语背后的经济学原理。在标准化的回答方面,文心一言与 GPT-4 旗鼓相当。

应用生态

GPT-4 已经被微软采用,并得到了微软方面的证实。微软给 OpenAI 提供超算服务吸引企业来使用 Azure 训练自己的大模型,同时直接在 Azure 中提供 OpenAI 模型服务(Azure OpenAI Service),此前包括 GPT-3、Codex 和 DALL·E 2 等模型都已经接入 Azure。而文心一言在百度内部已经接入了百度搜索、小度和自动驾驶 Apollo 等产品,目前生态方面也仅限于国内。

背后原理

GPT-4 脱胎于前代模型 GPT-3,采用了有监督精调、人类反馈强化学习和提示构建等技术。而文心一言主要脱胎于两大模型——百度 ERNIE 系列知识增强千亿大模型,以及百度大规模开放域对话模型 PLATO。文心一言还采用了知识增强、检索增强和对话增强技术等“百度特色”的技术。

总结

虽然 GPT-4 在多模态能力、数理逻辑推算和编程方面表现出色,但与此同时,文心一言在中文

理解和应用生态方面具有明显优势。此外,文心一言也具有多模态生成和对话增强功能。虽然与 GPT-4 相比仍有差距,但作为国内 AI 头部企业的百度,其实力还是不容小觑的。随着时间的推移,相信国产 AI 会有着属于自己的辉煌,为更多人服务。