谁才是真正的“前端还原大师”?GLM-4.6v、Gemini 3.0 Pro 与 Figma Make 深度横评
前几天 GLM-4.6v 发布,榜单上又是各种 SOTA 刷屏。按理说,面对 AI 圈这种“日日刷新”的节奏,我早该习以为常、一笑了之。但看着满屏的讨论(姑且不论是否包含营销水分),再加上这几天深度使用 Vibe Coding 写前端,Opus 4.5 的表现确实惊艳,让我不得不重新审视这些宣传。
各家都号称能“100% 还原前端”,包括前几天发布的 Gemini 3.0 Pro 也夸下海口,我就亲手做个简单测试,看看现在的多模态大模型到底进化到了什么程度。最近模型能力进步太快,看着设计师、程序员和产品经理“被失业”的论调满天飞,心里难免有些担忧。
【测试对象】
我选择了 魔搭社区(ModelScope) 的主页作为测试案例。这个页面不算特别复杂,但相比官方演示中那些简单的纯表格布局,显然更具挑战性,也能看出模型的真实水平。
1. GLM-4.6v 直接生成 HTML
评价: 整体布局的大框架没有问题,但在一些图标细节处理上存在偏差,排版布局也稍显粗糙,有一些肉眼可见的小瑕疵。 网页预览
2. Google Stitch (Gemini 2.5 Pro)
注:Stitch 是 Google 推出的 AI原型设计软件,可直接生成网页代码和 Figma 文件。
评价: 这一组的效果肉眼可见地差了一截。尤其是主 Banner 部分,我尝试让它修改了两次也未能纠正过来,其他细节更是无力吐槽,可用性较低。
3. Figma Make (优化 GLM-4.6 代码)
测试逻辑:将 GLM-4.6 生成的代码及截图投喂给 Figma Make 进行二次优化。Figma Make 基于 React 框架,底层模型使用的是 Gemini 3.0 Pro。
评价: 经过优化后,确实修正了原代码中图标的一些细节问题,整体页面的精致度提升了不少。 网页预览
4. Figma Make (直接生成)
测试逻辑:直接发送图片让其生成。
评价: 个人认为这一版的还原度相当不错。除了卡片的背景颜色有偏差外,其他元素的复刻都很有水准。网页预览
5. Gemini 3.0 Pro 直接生成
评价: 这应该是本轮测试中还原度最高的一位。 网页整体显得更加精致,主 Banner 下方的三个小卡片颜色也能准确识别。不过令人费解的是,似乎所有大模型在“推荐卡片”的背景色还原上都集体翻车了,没有一个能完美复刻。网页预览
【总结】
通过这几轮测试,结果已经非常明朗了:
- Gemini 3.0 Pro 在本次测试中拔得头筹,无论是整体布局的精致度还是对细节颜色的捕捉,都展现出了“降维打击”般的实力。
- Figma Make 证明了“AI + 设计工具”的工作流不仅可行,而且效果显著,特别是它能基于现有代码进行二次优化的能力,非常适合实际开发场景。
- GLM-4.6v 虽然在细节上稍逊一筹,但作为国产模型,其基座能力依然在线,大框架把控得当。
不过,值得玩味的是,所有模型在“推荐卡片背景色”这一项上集体翻车。这说明目前的视觉大模型虽然能处理复杂的逻辑和布局,但在某些特定的视觉特征提取上,距离宣称的“100% 完美还原”仍有最后一公里的路要走。