我用一段Prompt,生成了一个能种田的3D迷你村庄编辑器|AI Native思维实战

14 阅读8分钟

当“物理模型世界”遇上LLM,程序员的高成本需求正在被重新定义。

最近我迷上了一种“摆在桌上的小模型”的感觉——不是开放世界游戏,而是一个精致的、8×8 格子的 3D 迷你村庄编辑器。你可以点击格子放草地、种树、盖房子、挖水塘,还能拖拽旋转视角、缩放观察。最“离谱”的是,这个项目的全部代码,都是由一段Prompt生成的,零构建,双击HTML就能跑。

今天我打算把这个案例拆开揉碎,和你聊聊它背后的 AI Native 思维Prompt 意图拆分以及大模型是如何把“高成本程序员的需求”变成唾手可得的数字资产的。


一、先看看这个“小世界”长什么样

打开网页的那一刻,你看到的不是一个复杂的引擎界面,而是一个奶白色背景上悬浮的 8×8 小棋盘,像一个微缩景观沙盘。

  • 7 种工具:草地、水、房子、树木、土地、石头、橡皮擦。每个都是底部工具卡片里的 emoji + 中文标签,点击就能在格子上放置。
  • 3D 积木风:所有物体都由 Three.js 内置几何体拼搭(Box、Cone、Cylinder、Icosahedron),没有任何外部模型或贴图。颜色饱和、对比明确,阴影柔和,光照是温暖的“日光感”,而不是惨白的演播室灯光。
  • 细节拉满:鼠标悬停的格子有高亮反馈;右下角有个 2D Canvas 小地图,俯视显示地形色块和建筑剪影;支持 3 个存档世界,关闭浏览器再打开,数据完好无损。
  • 两个魔法按钮:“重置”会程序化生成一个有水塘、石堆、房屋、连通小路的小村庄;“清空”把所有格子恢复成草地,瞬间回归自然。

UI 是浅色磨砂玻璃风格,半透明背景、圆角、轻微模糊,像 iOS 小组件一样干净。首次打开时,屏幕上会浮出一行淡出的提示:“拖拽旋转 · 滚轮缩放 · 点击放置”。

关键点来了——这个项目总共有三个文件:一个 HTML、一个 CSS、一个 JS。Three.js 通过 CDN 引入 r128 版本,没有用 ES module、没有 import map、没有 npm 那一套。  所有的 3D 交互逻辑、持久化、小地图渲染、程序化生成,全部塞在一个 IIFE 包裹的 JS 文件里,用清晰注释分隔成场景/光照/数据/工厂/交互/持久化/小地图/启动等段落。

你可能会问:这种小而美的项目,看起来简单,但真让一个人从零写,得花多少时间?

答案就藏在 AI Native 思维 里。


二、Prompt 设计:把“行业经验”压缩进一段话

如果只是对 LLM 说“给我写个 3D 村庄编辑器”,你大概率会得到一个粗糙的、跑不起来的骨架。真正的秘密在于 Prompt 的意图拆分。

在这个案例中,我并不是一次性丢出所有需求,而是按照结构化方式拆解:

  1. 定位与体验:先明确不是开放世界游戏,而是“桌上小模型”,强调 8×8 规模、立刻能玩、拖拽旋转、滚轮缩放。这直接约束了 LLM 生成的技术选型和交互复杂度。
  2. 视觉与光照:指定“积木玩具风”、奶油色背景、无天空、日光感阴影、柔和的阴影。这些细节排除了 Three.js 的默认天空球或硬阴影生成,告诉模型渲染方向。
  3. UI 布局:顶部标题 + 存档面板,底部工具卡片,右下小地图,全部磨砂玻璃风格。这相当于给出了一个完整的 UI 设计稿,只不过是用自然语言描述的。
  4. 技术边界:单页面、零构建、CDN 引入 r128、不要 React/Vue/TypeScript、不依赖 OrbitControls、只使用内置几何体。这一连串否定条件,是对模型生成能力的强约束,也是高成本程序员最常面临的“环境限制”——不能乱装依赖,必须开箱即用。
  5. 数据与持久化:要求 world[x][z] = { terrain, kind } 作为唯一数据入口,这相当于定义了一套 MVVM 的数据层规范,AI 生成的所有代码都会围绕这个中心展开。

这种 Prompt 设计本质上是一次领域知识的外化:你不需要直接写代码,但需要把“如何构建一个 3D 小世界”的隐性经验,转化为 LLM 可理解的结构化指令。这比单纯写代码更需要抽象能力。


三、AI Native 不止生成代码,还能“干活”

如果说 Prompt 是大脑,那 Coding Agent(比如 Cursor、Claude Code、Trae)  就是手脚。在这个项目里,我没有手动创建过任何一个文件——Agent 直接在我的本地目录里生成了 index.html、style.css、app.js,并把完整的代码写入。

这就是“AI Native 开发流”与传统 Copilot 模式的最大区别:

  • Copilot 是副驾驶,帮你补全代码片段;
  • Coding Agent 是主力工程师,它理解你的意图,直接执行“创建文件、写入代码、甚至运行检查”的全流程。

你会发现,过去我们困扰于配置 Webpack、调整 Babel、处理模块依赖,这些重复劳动正在被 Agent 直接绕过。而对于高成本程序员来说,最耗时的往往不是核心逻辑,正是这些“工程胶水”。用一句话让 Agent 把这部分省掉,省下的不是几行代码,而是大量的心智负担。


四、大模型差异:为什么复杂任务需要“高级模型”

这次生成过程中,我也试验了不同模型的效果:

  • 用一些轻量模型时,可能会把 3D 交互写成硬编码的相机移动,无法处理好阴影、磨砂 UI、Canvas 小地图等细节;
  • 切换到 DeepSeek 最新的 V4 系列(Pro 版参数规模达到 1.6 万亿,Flash 版也达到了 2840 亿参数),复杂指令遵循能力大幅上升,在生成积木几何体拼搭、数据持久化逻辑、IIFE 代码组织等方面明显更可靠。

这背后的原理并不神秘。大模型本质上是一个由海量权重参数构建的概率映射函数——输入语义序列 x,经过参数 θ 的运算,拟合语言规律,输出连贯合理的结果序列 y。参数规模越大,模型对复杂约束的建模能力就越强,越能生成符合多层嵌套需求的代码。

另外值得一提的是,DeepSeek 最新模型已经在华为芯片上完成适配,意味着这类高级模型正在逐步摆脱对传统 GPU 的绝对依赖。对本地开发者来说,配合 Ollama 这样的本地大模型管理平台,甚至可以在自己的机器上跑起百亿级别参数的开源模型,实现离线的 AI 编程助手。这为工业 4.0、具身智能、车载算力等场景打开了新的想象空间。


五、重定义“高成本需求”:从“写代码”到“写意图”

仔细想想,“3D 小世界编辑器”这个需求,在传统开发中属于成本极高的那一类:

  • 需要 3D 前端知识(WebGL、Three.js 的进阶用法);
  • 需要 UI/UX 设计能力(磨砂玻璃、小地图、工具卡片);
  • 需要游戏开发思维(网格系统、放置逻辑、程序化生成);
  • 需要工程化能力(构建、依赖管理、持久化)。

这样一套组合拳,往往需要一个小团队才能完成。但现在,通过 LLM + Prompt 工程 + Coding Agent,一个人、一段话、几分钟,就得到了一个功能完整的交互式项目。

这不是“AI 替代程序员”的简单叙事,而是需求满足路径的范式转移。程序员不再是逐行代码的生产者,而是意图的设计者和系统的编排者。你要做的是:

  1. 拆解体验目标,转化为结构化约束;
  2. 定义数据边界和技术限制;
  3. 用自然语言描述 UI 布局和视觉风格;
  4. 交给 AI 执行,然后进行少量调试和微调。

这种工作流的效率提升,尤其在原型验证、内部工具、教育游戏等场景下,是数量级层面的。


六、写在最后:每个程序员都值得有一个“迷你世界”

这个 8×8 的小世界,就像一个数字化的沙盘。它的意义不仅在于“好玩”,更在于它是一份用 AI Native 思维交付的完整产品说明书——证明了即使是看似复杂的 3D 交互应用,也可以通过 Prompt 设计,让 AI 直接生成可运行的项目。

未来,当有人再提出“我想要一个简单的 3D 编辑器”时,我们不再需要从脚手架开始搭建,只需要打开一个聊天窗口,把那些藏在脑海里的行业经验、领域知识,翻译成一段精准的指令。

代码会过时,但清晰表达需求的能力不会。