记一次ai模型比较

79 阅读1分钟

有趣的一次经历,记录于2025-2-13

当我对于无符号右移的计算结果及过程产生疑问时,我分别向文心一言、deepseek、chatgpt、通义千问问了一个相同的问题,结果。。。。。。

记录ai模型在发展过程中存在的瑕疵。

问题:-127的无符号右移2位,结果是?(对应的英文版:What is the result of unsigned right shift of -127 by 2 bits?)

  1. 文心(文心大模型3.5)的回答

差强人意

Screenshot 2025-02-13 at 5.32.30 PM.png

Screenshot 2025-02-13 at 5.32.51 PM.png

Screenshot 2025-02-13 at 5.33.10 PM.png

追问之下

Screenshot 2025-02-13 at 4.58.37 PM.png

  1. deepseek(deepseek v3)

Screenshot 2025-02-13 at 5.00.18 PM.png

追问要求非java环境下,结果如何?

Screenshot 2025-02-13 at 5.03.54 PM.png

Screenshot 2025-02-13 at 5.04.04 PM.png

3.chatgpt(GPT-4-turbo)

在询问是否可以使用中文提问并获得肯定答复后,chatgpt给出的回答

Screenshot 2025-02-13 at 5.06.30 PM.png

Screenshot 2025-02-13 at 5.06.43 PM.png

结果是离了大谱,考虑到可能语言适应能力问题,使用英文问了一遍

Screenshot 2025-02-13 at 5.08.59 PM.png

Screenshot 2025-02-13 at 5.09.12 PM.png

Screenshot 2025-02-13 at 5.09.27 PM.png

还好,成功挽尊。

再一次强行要求8-bit环境下,结果如何?

Screenshot 2025-02-13 at 5.11.23 PM.png

看来chatgpt的语言理解还是要加把劲。。。。。。

  1. 通义千问(未指明版本,2025-02-13)

Screenshot 2025-02-13 at 5.14.46 PM.png