对比测试了一下刚刚发布的 Mistral Large 和 GPT-4,使用相同的 prompt 来总结文章,感觉 Large 能力逼近 GPT-4 了。左图是 Mistral Large,右图是 GPT-4

测试网站:chat.lmsys.org
江昪于2024-02-28 08:53发布的图片
1