哈哈哈哈哈哈!
Claude 最强模型面世,我忍不住做了一波对比测试,笑死我了。
让我惊讶的不是 Claude Fable 5 有多强,而是其它模型弱爆了!
当然反过来说,也是 Fable 5 太强了,其实 Opus4.8 已经足以干翻所有人了。
我总共测了四个平台啊,一个是 Fable 5,另外三个作为参考,有国外的,有国内的!
我尽量控制我的“嘲讽技能”!无恶意,我相信大厂们不会那么“小气”。
首先我们来看下,大家最关心的 Fable 5 的情况。
寓言
Fable 的中文意思大概就是“寓言”。我们先来看一下这个“寓言”怎么样?
开始之前,我先交代一下我的测试环境。
因为最近网络波动比较大,像 Fable 这种模型,一思考就会挂起来很久,直接会被中断,我就不用 CC 来测试了。
我就直接用网页版来测试,一般来说,用智能体肯定要比网页强一些,那公平起见,大家都用网页版来测试!
然后,我们的测试题目就是这一个:
之前以及测试了14个模型,参考数据非常丰富。
这个测试的完整需求如下:
请不要直接画图,而是编写一段 单个 HTML 文件 的代码,当我用浏览器打开它时,能看到一幅动态的、赛博朋克风格的《清明上河图》长卷。 需要充分结合清明上河图的古风和赛博朋克的元素。
让画卷内容和细节丰富。
要求:
画面需要自动从右向左缓缓滚动。
必须包含至少 50 个动态元素:如闪烁的霓虹灯招牌、飞行的汽车、全息投影的广告、街头的机械义肢行人。
鼠标悬停在任意店铺上时,要弹出一个赛博风格的信息卡片(如“老王义体维修店 - 好评率 98%”)。
关键技术点:
SVG/Canvas 绘图编程能力
CSS 动画逻辑
鼠标交互事件处理
审美设计与视觉呈现
我把题目要求和关键技术点全都给他们了,明牌测试,看它们能力上限!
不要小看这个题目,这个题目是不简单的,看到后面就知道了。
我就直接上结果了:
这就是 Claude Fable 5 直接在网页版做出来的效果,纯代码写出来的,没有引用任何第三方资源!记住这个画面,后面有用。
然后我记录一下测试过程,不关心过程的,可以直接看下一章!
这里,我必须先把早上说的“价廉物美”这句话吞回去!虽然从数据对比上来说,只是比 Opus4.8 贵了一倍,但是实际消耗是非常恐怖的。
你们看,我是满血状态开始测试的:
因为 Fable 上线,Claude 官方重置了所有人的配额。
然后,我就开开心心开始测试了:
整个过程是有点漫长的,大概消耗了 23 分钟!!!
中途还压缩了一次对话。可见它思考的上下文非常非常长。当然可能也和网页版有一定的关系。
等它跑完之后,我去看了一眼配额,天塌了:
一个网页,直接干掉 63%。
当我想进一步测试的时候 🤣……立马就看到了下面的场景:
对于这种情况,我无FK可说。
我用终端看了一眼,配额被干到了 112%。
现在 Claude 的网页版也是极其强大的,绝对已经上了轻量智能体了。整个思考过程输出内容非常多。
展开整个过程非常长,我数了一下大概有 38 个节点!
网页版都恐怖如斯了啊,以后即便是在网页上的chat功能里,我也不敢随便开高级模型了,消耗太恐怖了。
当然结果也是很不错的:
光开头这个清明上河图,赛博汴京,加上红色的汴字。已经可以秒了所有人了。
它还把虹桥也给画出来了:
桥上有飞行器、外卖无人机,桥下有船和倒影,背后是高楼大厦,还有一点远山的影子,天空中有星星点点。
各种各样的店铺:
然后它把各种各样的店铺也给你做出来了,比如老王义体维修店,好评率 98%,40 年老店,子时不打烊,以旧换新。Slogan 是“左臂换新,立等可取;军规义眼,童叟无欺”。
这里还有王家纸马“数字往生一键超度”,还有“高价回收记忆”!
反正需求中的店铺、广告牌、飞行器都是有的。飞行器分为两种,做得都很精致,一种是感觉可以坐人的,还有一种是投递快递的无人机。
注意他们的线条都是非常柔和的,然后外形是非常形象的。我还看到一个拉驴的,不是,是驴拉着货的!
整体来说不能算完美,但是很不错了,让它他做的都做了。当然,至于做得好不好,一方面是看自己,另一方面还得靠同行衬托!
死敌
众所周知,Anthropic 和 OpenAI 是全球最强的两家AI公司,他们应该会在下半年上市,预估市值都是万亿起步。最近 Anthropic 反超了 OpenAI。都说同行是冤家,这绝对是死敌了。按理说,这个时候奥特曼应该也开个大招来狙击一下,才对。
基于这种情况,我们必须也要来测一把GPT5.5了!
下面是 ChatGPT 官网的测试情况:
GPT-5.5 虽然已经开启了思考模式,强度中等,但在网页上很显然非常敷衍。它只用了 17 秒就把这个网页做好了。
效果是这个样子:
这着实是有点抽象啊,上面那个椭圆难道就是飞行器?然后那一块黑的难道是个人?那个小的是招牌还是啥玩意儿?颜色倒是挺红红绿绿的,挺赛博的,但这个东西实在是太抽象了!
这结果实在没眼看啊,我就破例用 Codex 再跑一次。
大概用了十几分钟吧,终于跑完了:
这个元素好像比之前的丰富了很多,但是整体的线条和设计感还是很粗糙,人在水里,桥在陆地!
这种应该就是模型本身的能力,就这样了,你再怎么提示都没有用了。
GPT-5.5 的前端能力,如果大家用过的话,应该都是有数的!
给我的感觉是,Fable 5 有点像大师作品,而 GPT-5.5 有点像卡通画。
GPT5.5 我们就看到这里了。
下面再来找几个测试对象吧。
大家最喜欢讨论的是国产模型和国外顶尖模型的差距是在缩小还是放大。这个东西谁也说不清。
国产模型实力基本上都在“基准”数据中,看起来都挺猛,宣传也都挺猛的。
平日里都在对标、逼近、超越,今天就拉出来……正面 PK 下。
我就选最近营销最猛的两个M,缩写都是MM,为了防止关键词触发,我就叫他们“卧龙”和“凤雏”吧!
卧龙
卧龙最厉害的是它的 Credits,可以一下子给到几百亿。最近在猛推 1000 tokens/s 的极速模型,已经看到各种牛逼的帖子了。
反正数字是一个比一个牛逼,要论实力嘛:
哈哈哈哈!
你们知道我为何开头笑那么大声了吧!
我这绝对是实测啊,在他们官网的 AIStudio 里面测试的:
大概是跑了 334.7 秒,开始吐出代码。
然后又吐了好一会儿,时间上,应该不算长,我估计没到十分钟。
这个时间其实还可以,但是结果不完全不显示内容。这个问题好像在之前的测试中遇到过好几次。比如那个《掌门日记》,也是不显示内容。
当时是出了一个低级的 JS 错误。
然后我看了一下这次的例子,也是一个 JS 错误:
Uncaught SyntaxError: Invalid shorthand property initializer
这个错误也高级不到哪里去:
这是 JavaScript 语法错误,意思是:
对象字面量里写了非法的属性初始化方式。
最常见原因是你在对象 `{}` 里把 `:` 写成了 `=`。
这个事情吧,哎!初级程序员也不应该犯这种错误吧。
好了,不多说了,大家自己品吧。
凤雏
凤雏也是很厉害的角色,在“上上代”模型的时候,就喊出了最强编程智能体。最近发布了升级版的 Model3,更是“不得了”,宣传稿大家应该也看过很多了,吹得神乎其技。
按逻辑上来讲,如果爷爷已经是最强了,那孙子绝对无敌了。
然后我就跑去体验它们最强的 Agent Team 了。
然后死活发不出去。按钮一点,就是一个抖动,啥都没发生。好吧,可能是我的问题!
没办法,只能切换他们老版本的 Agent 了。
这次表现不错,按钮是可以按的!
然后,“卧龙”已经干完了,“凤雏”却还没想明白:
从上午干到下午,饭都吃完了。终于有结果了:
结果就是“API Error:Connection error。”
哈哈哈哈哈,知道我开头为什么笑得这么大声了吧!
这一定是我的网络问题,我们再试一次。
这次架势很足,右边都已经出现 Todo 列表了,我感觉是十拿九稳了。
十分钟后,告诉我“System restarted...”!
额,把系统搞崩了???
看起来猛得不行,又是 Agent,又是 Agent Team!干起活来,不是中断,就是重启。
怎么说呢?你说智能体小组是吧,如果一个智能体都搞不好,那你搞一组的智能体有什么用呢!
除了宣传上看起来好看一点,我真的想不出有什么用!
我已经断断续续跑了几个小时了,就不再浪费生命了。
我就贴一个之前它在CC上跑出来的结果:
大概就是这种水平了!
所有元素都非常原始,灯笼是挂在地面的,人是在空中飞的。风格嘛,你如果不看这个名字叫清明上河图,那跟清明上河图没有半毛钱关系。
说实话,这个测试还是让我挺意外的。
我第一眼看到 Fable 的结果,我觉得哎还可以,也就一般般吧。但是当我慢慢往后测,突然之间,我对 Fable 5 的敬仰就犹如滔滔江水,绵绵不绝。
而且我这里的测试还不是 Fable 5 最厉害的地方,我是专挑它们没有训练到的地方来测的。如果你们看了其他文章或者国外的一些帖子,可以看到它在游戏制作方面非常强大。
其实做得不好也没有关系,大家真诚一点、坦白一点就好了!
好了,就这么多吧。我的配额又回来了,继续测后面的内容!
我这里所有的截图、所有的例子、所有的内容全部真实,而且全部是单次测试。我的账号里都有完整的对话记录!
随手一测,就充满了乐趣啊!
所有例子我都放在这里了:
也包含了完整的提示词!
我最后还让他做了一个可以切换远景,近景,中景的版本。远景要写意!
image-20260610161349928
大家也可以用我这套提示词去试试看,目前这个例子应该还没有被优化训练。做得好的就是真的做得好,做得不好的就真的做得不好。
好了,这个例子就这样吧。
结论是:Fable5 真的是遥遥领先!
如果这篇文章对你们选模型有用,或者让你们“开怀一笑”。
记得点个赞!
点赞不要钱,但是是对我莫大的鼓励。