同时体验 GPT 3.5 和百度文心一言让我感觉文心一言似乎是个呆子

2023-08-21 336 阅读3分钟

一个好消息：通过了文心一言内测申请

今天上班摸鱼中，突然收到了百度文心一言的内测申请通过信息，这让我想起前段时间曾申请了该内测资格。由于我最近频繁使用ChatGPT3.5（ChatGPT4后面有机会付费体验一下），我觉得与百度文心一言的表现进行一番对比，或许能有更深入的了解。
不妨先说说我的结论：百度作为远古的BAT三大巨头，在人工智能领域投入相当可观。然而，推出的百度文心一言却让我略感失望。与ChatGPT3.5相比，我不禁觉得文心一言似乎有些局限，更不必提与ChatGPT4的对比。从目前来看，国内人工智能领域还有很长的发展路程要走。
尽管如今人工智能领域仍面临许多挑战，但随着技术的不断发展，我们可以充满期待地预期更多的创新和进步。

ChatGPT3.5 vs 文心一言

本文主要从交互界面、对话流畅性和连贯性、拟人类测试三个方面来进行简单的测试，重点在后面两点的测试。

交互界面

两者的交互界面、操作基本一致没有太大的差别。

ChatGPT3.5

百度文心一言

对话流畅性和连贯性

对于流畅性和连贯性我这里设定了一个场景，我先告诉 AI 我喜欢去有海的地方旅游，然后让 AI 推荐给我旅游地方，大家可以先思考一下自己的回答。

ChatGPT3.5

百度文心一言

这一轮的对比，大家依然不分伯仲，两大 AI 都能理解整个语境上下文，并给出一些合理的建议。

拟人类测试

情感和人性化

这一轮，我设定我被别人欺负了，希望它可以安慰我。

ChatGPT3.5

百度文心一言

这一轮可以明显的看出，百度文心一言对语境上下文的的理解有一定的问题，让人感觉有一种割裂感并不连贯。反观 ChatGPT3.5 依然表现出色。

自我学习能力

自我学习这一轮，我告诉 AI 在我的家乡称呼妹妹为姐姐，让它告诉我如果它在我的家乡，它应该如何称呼它的妹妹。

ChatGPT3.5

百度文心一言

在这一轮中，文心一言甚至无法准确的理解我想表达的意思，反观 ChatGPT3.5 不仅准确的回答了我的问题，更是发表了自己的观点。

伦理和政治

这一轮，我以最近比较热门的台湾问题为例，让两大 AI 发表自己的看法。

ChatGPT3.5

百度文心一言

这一轮中，百度文心一言似乎败得更加惨烈，仅仅是对名词做了解释，并没有表达自己的观点，完全看不出文心一言出自百度之手，确实让人很费解。

结论

上述观点仅代表个人体验之后的一些看法，整体上无论是语境的连贯性，和观点表达、以及自我学习能力 ChatGPT3.5 远远超过百度文心一言，更不用和 ChatGPT4 对比，正如标题所说，感觉文心一言似乎是个呆子。这也从侧面反映出国内目前人工智能的一些进展情况，目前给我的感受就是，一个能打的都没有，只能说吾辈还需努力。