事情的起因是这样的,昨天玩一个方块染色类的益智游戏,但是有一关试了几次都没过。
想到,现在AI大模型这么厉害,可以试试用AI大模型来通过这个关卡,顺带还能测试一下大模型的能力。
于是发生了接下来的事。
游戏规则是这样的:在固定的步数内,让所有的方格颜色一致。点击方块能让周边的方块变成它的颜色,颜色可以进行传播。
首先上场的是豆包AI大模型
我将图片和要求发给了豆包,得到的回复有点耐人寻味。
先看回复,能明显感觉到图片识别有问题,将红色方块,识别为蓝色方块,剩下两步颜色识别确实没问题。
我要求重新纠正颜色问题,并重新识别,得到的回复颜色确实变了,这一次错的更离谱。
不仅将红色方块识别成了浅绿色,连带着2,3步的方块颜色也将蓝色识别成了浅绿色。
两次回答虽然颜色有问题,但要求点击的方块确实都是同一个。
为了避免受上下文影响,我重新开了一个对话,问豆包,第一行第三列什么颜色。得到的是浅蓝色。。。
按照豆包AI的回答,测试最终成果,得到下图效果。
可惜的是三步之内并不能让所有方块变成同一颜色,豆包AI的回答是错误的。
接下来上场的是Kimi
同样将问题和图片发送给Kimi。
还是同样的颜色识别有问题,将红色方块识别为粉色,好像看着是有点偏粉色,但是豆包把它识别成浅蓝色我是没想到的。
第二步开始就错了,点击红色方块并不能将第二行第二列的方块变成粉色。
使用Kimi的回答进行演示。
在我将颜色问题反馈后,Kimi进行了反思,并给出了另一个方案。
虽然第一行的颜色问题纠正了,但是第二步和第三步的颜色又识别出问题了。
抛去颜色问题,按照Kimi回答的列数进行点击,查看最终效果。
结果还是无法在3步之内将所有方块变成同一颜色。,最终还是有两个方块没有被改变。
接下来是通义千问
同样颜色识别不对,只能按照位置进行点击。
颜色错误之后要求重新识别,但依然坚持中间方块为粉红色...
最终得出的答案运行效果,还是无法做到所有方块颜色一致。
下面上场的是腾讯元宝
颜色识别没问题,但位置有问题。而且这个思路并不适合3步之内,适合不限制步数的情况下进行。
下面就是胡言乱语了,不必理会。
最后上场的是ChatGPT
位置描述不正确。
使用位置和颜色描述都做不到3步之内让所有方块变成同一颜色。
从回答的布局可以看到,完全与图片不一样,有点胡言乱语的感觉,同样点击步骤也是错误的。
以上测试案例并不充足,而且只进行了两轮问答。
但能看出,大部分AI大模型的图像识别都不是很准确,要么颜色有问题,要么位置有问题。
如果抛弃掉图像识别,将颜色以文字形式给到AI大模型,可惜得到的答案还是错误的。
最后还是要依靠人类聪明的小脑瓜~
以上就是今天的分享了,祝大家玩的开心~
欢迎点赞、关注,鼓励我继续创作。