同时体验 GPT 3.5 和 百度文心一言 让我感觉文心一言似乎是个呆子

324 阅读3分钟

一个好消息:通过了文心一言内测申请

  • 今天上班摸鱼中,突然收到了百度文心一言的内测申请通过信息,这让我想起前段时间曾申请了该内测资格。由于我最近频繁使用ChatGPT3.5(ChatGPT4后面有机会付费体验一下),我觉得与百度文心一言的表现进行一番对比,或许能有更深入的了解。
  • 不妨先说说我的结论:百度作为远古的BAT三大巨头,在人工智能领域投入相当可观。然而,推出的百度文心一言却让我略感失望。与ChatGPT3.5相比,我不禁觉得文心一言似乎有些局限,更不必提与ChatGPT4的对比。从目前来看,国内人工智能领域还有很长的发展路程要走。
  • 尽管如今人工智能领域仍面临许多挑战,但随着技术的不断发展,我们可以充满期待地预期更多的创新和进步。

DM_20230821213554_001.png

ChatGPT3.5 vs 文心一言

  • 本文主要从交互界面、对话流畅性和连贯性、拟人类测试三个方面来进行简单的测试,重点在后面两点的测试。

交互界面

  • 两者的交互界面、操作基本一致没有太大的差别。

ChatGPT3.5

DM_20230821213559_001.png

百度文心一言

DM_20230821213607_001.png

对话流畅性和连贯性

  • 对于流畅性和连贯性我这里设定了一个场景,我先告诉 AI 我喜欢去有海的地方旅游,然后让 AI 推荐给我旅游地方,大家可以先思考一下自己的回答。

ChatGPT3.5

DM_20230821213613_001.png

百度文心一言

DM_20230821213618_001.png

  • 这一轮的对比,大家依然不分伯仲,两大 AI 都能理解整个语境上下文,并给出一些合理的建议。

拟人类测试

情感和人性化

  • 这一轮,我设定我被别人欺负了,希望它可以安慰我。

ChatGPT3.5

DM_20230821213622_001.png

百度文心一言

DM_20230821213627_001.png

  • 这一轮可以明显的看出,百度文心一言对语境上下文的的理解有一定的问题,让人感觉有一种割裂感并不连贯。反观 ChatGPT3.5 依然表现出色。

自我学习能力

  • 自我学习这一轮,我告诉 AI 在我的家乡称呼妹妹为姐姐,让它告诉我如果它在我的家乡,它应该如何称呼它的妹妹。

ChatGPT3.5

DM_20230821213631_001.png

百度文心一言

DM_20230821213635_001.png

  • 在这一轮中,文心一言甚至无法准确的理解我想表达的意思,反观 ChatGPT3.5 不仅准确的回答了我的问题,更是发表了自己的观点。

伦理和政治

  • 这一轮,我以最近比较热门的台湾问题为例,让两大 AI 发表自己的看法。

ChatGPT3.5

DM_20230821213638_001.png

百度文心一言

DM_20230821213642_001.png

  • 这一轮中,百度文心一言似乎败得更加惨烈,仅仅是对名词做了解释,并没有表达自己的观点,完全看不出文心一言出自百度之手,确实让人很费解。

结论

  • 上述观点仅代表个人体验之后的一些看法,整体上无论是语境的连贯性,和观点表达、以及自我学习能力 ChatGPT3.5 远远超过百度文心一言,更不用和 ChatGPT4 对比,正如标题所说,感觉文心一言似乎是个呆子。 这也从侧面反映出国内目前人工智能的一些进展情况,目前给我的感受就是,一个能打的都没有,只能说吾辈还需努力。