谁才是真正的“前端还原大师”？GLM-4.6v、Gemini 3.0 Pro 与 Figma Make 简单横评

前几天 GLM-4.6v 发布，榜单上又是各种 SOTA 刷屏。按理说，面对 AI 圈这种“日日刷新”的节奏，我早该习以为常、一笑了之。但看着满屏的讨论（姑且不论是否包含营销水分），再加上这几天深度使用 Vibe Coding 写前端，Opus 4.5 的表现确实惊艳，让我不得不重新审视这些宣传。

各家都号称能“100% 还原前端”，包括前几天发布的 Gemini 3.0 Pro 也夸下海口，我就亲手做个简单测试，看看现在的多模态大模型到底进化到了什么程度。最近模型能力进步太快，看着设计师、程序员和产品经理“被失业”的论调满天飞，心里难免有些担忧。

【测试对象】

我选择了 魔搭社区（ModelScope） 的主页作为测试案例。这个页面不算特别复杂，但相比官方演示中那些简单的纯表格布局，显然更具挑战性，也能看出模型的真实水平。

评价： 整体布局的大框架没有问题，但在一些图标细节处理上存在偏差，排版布局也稍显粗糙，有一些肉眼可见的小瑕疵。网页预览

注：Stitch 是 Google 推出的 AI原型设计软件，可直接生成网页代码和 Figma 文件。

评价： 这一组的效果肉眼可见地差了一截。尤其是主 Banner 部分，我尝试让它修改了两次也未能纠正过来，其他细节更是无力吐槽，可用性较低。

测试逻辑：将 GLM-4.6 生成的代码及截图投喂给 Figma Make 进行二次优化。Figma Make 基于 React 框架，底层模型使用的是 Gemini 3.0 Pro。

评价： 经过优化后，确实修正了原代码中图标的一些细节问题，整体页面的精致度提升了不少。网页预览

测试逻辑：直接发送图片让其生成。

评价： 个人认为这一版的还原度相当不错。除了卡片的背景颜色有偏差外，其他元素的复刻都很有水准。网页预览

评价： 这应该是本轮测试中还原度最高的一位。网页整体显得更加精致，主 Banner 下方的三个小卡片颜色也能准确识别。不过令人费解的是，似乎所有大模型在“推荐卡片”的背景色还原上都集体翻车了，没有一个能完美复刻。网页预览

通过这几轮测试，结果已经非常明朗了：

不过，值得玩味的是，所有模型在“推荐卡片背景色”这一项上集体翻车。这说明目前的视觉大模型虽然能处理复杂的逻辑和布局，但在某些特定的视觉特征提取上，距离宣称的“100% 完美还原”仍有最后一公里的路要走。