同时体验 GPT 3.5 和 百度文心一言 让我感觉文心一言似乎是个呆子
一个好消息:通过了文心一言内测申请
- 今天上班摸鱼中,突然收到了百度文心一言的内测申请通过信息,这让我想起前段时间曾申请了该内测资格。由于我最近频繁使用ChatGPT3.5(ChatGPT4后面有机会付费体验一下),我觉得与百度文心一言的表现进行一番对比,或许能有更深入的了解。
- 不妨先说说我的结论:百度作为远古的BAT三大巨头,在人工智能领域投入相当可观。然而,推出的百度文心一言却让我略感失望。与ChatGPT3.5相比,我不禁觉得文心一言似乎有些局限,更不必提与ChatGPT4的对比。从目前来看,国内人工智能领域还有很长的发展路程要走。
- 尽管如今人工智能领域仍面临许多挑战,但随着技术的不断发展,我们可以充满期待地预期更多的创新和进步。

ChatGPT3.5 vs 文心一言
- 本文主要从交互界面、对话流畅性和连贯性、拟人类测试三个方面来进行简单的测试,重点在后面两点的测试。
交互界面
ChatGPT3.5

百度文心一言

对话流畅性和连贯性
- 对于流畅性和连贯性我这里设定了一个场景,我先告诉 AI 我喜欢去有海的地方旅游,然后让 AI 推荐给我旅游地方,大家可以先思考一下自己的回答。
ChatGPT3.5

百度文心一言

- 这一轮的对比,大家依然不分伯仲,两大 AI 都能理解整个语境上下文,并给出一些合理的建议。
拟人类测试
情感和人性化
ChatGPT3.5

百度文心一言

- 这一轮可以明显的看出,百度文心一言对语境上下文的的理解有一定的问题,让人感觉有一种割裂感并不连贯。反观 ChatGPT3.5 依然表现出色。
自我学习能力
- 自我学习这一轮,我告诉 AI 在我的家乡称呼妹妹为姐姐,让它告诉我如果它在我的家乡,它应该如何称呼它的妹妹。
ChatGPT3.5

百度文心一言

- 在这一轮中,文心一言甚至无法准确的理解我想表达的意思,反观 ChatGPT3.5 不仅准确的回答了我的问题,更是发表了自己的观点。
伦理和政治
- 这一轮,我以最近比较热门的台湾问题为例,让两大 AI 发表自己的看法。
ChatGPT3.5

百度文心一言

- 这一轮中,百度文心一言似乎败得更加惨烈,仅仅是对名词做了解释,并没有表达自己的观点,完全看不出文心一言出自百度之手,确实让人很费解。
结论
- 上述观点仅代表个人体验之后的一些看法,整体上无论是语境的连贯性,和观点表达、以及自我学习能力 ChatGPT3.5 远远超过百度文心一言,更不用和 ChatGPT4 对比,正如标题所说,感觉文心一言似乎是个呆子。 这也从侧面反映出国内目前人工智能的一些进展情况,目前给我的感受就是,一个能打的都没有,只能说吾辈还需努力。