🎮 从“氛围编程”到“3D小世界”:我用一段Prompt搭了一个迷你村庄

3 阅读7分钟

当Vibe Coding遇上3D物理世界,一个人+一段Prompt = 一个完整的游戏编辑器

前言:OPC时代的下一个战场

在上一篇文章中,我们聊到了Vibe Coding(氛围编程)OPC(一人公司) 的概念——一个AI高手,借助Cursor、Claude Code、Codex等工具,胜任从产品经理到前端后端的全部角色。

今天,我们把这件事再往前推一步:不只是做一个网页应用,而是做一个3D游戏编辑器

当AI能够生成代码、创建文件、干活有“手脚”的时候,我们离“一人成军”的梦想又近了一步。

从生日贺卡到3D世界:Prompt能力的跃迁

还记得上篇文章里的生日贺卡应用吗?那是一个典型的L1级别Prompt任务:

维度生日贺卡3D小世界编辑器
交互复杂度表单输入 → 文本输出点格子放置 + 拖拽视角 + 存档切换
技术栈HTML/CSS/JSThree.js + Canvas 2D小地图
状态管理8x8网格 + 3个存档槽
视觉要求节日配色积木玩具风 + 柔阴影 + 日光光照

核心洞察:复杂任务需要高级模型。这就是为什么豆包等免费模型(参数量通常在百亿以下)在处理这类任务时会吃力,而GPT-4、DeepSeek V4等千亿/万亿级模型能够胜任。

LLM参数规模:为什么有的模型“更聪明”

在深入Prompt之前,先快速理解一下大模型的“肌肉”是怎么衡量的。

什么是LLM?

LLM(Large Language Model,大语言模型) 是依托海量数据训练、参数量庞大的深度神经网络模型(DNN)。它的本质是:

一个由海量权重参数构建的概率映射函数:输入语义序列(Prompt),通过参数运算拟合语言规律,生成连贯合理的输出。

数学上可以简化为:

text

y = fθ(x)
  • x = Prompt输入
  • θ = 全部模型参数(权重)
  •  = 大模型映射函数
  • y = 神经网络运算得到的结果

参数规模对比

模型参数规模定位
DeepSeek V4 Pro1.6T(1.6万亿)顶级,适配华为芯片
DeepSeek V4 Flash284B(2840亿)性价比之选
GPT-4约1.7T行业标杆
豆包等免费模型百亿以下轻量任务

💡 大模型参数的单位是 B(十亿,Billion)和 T(万亿,Trillion)。常见规格:百亿(10B)、千亿(100B)、万亿(1T)级别。

Scale AI:数据基石的重要性

训练这些大模型需要海量的高质量数据。这就是为什么:

  • 微软75亿美金收购GitHub
  • Meta 148亿美金收购(49%股份)
  • Scale AI专注于数据标注/训练/清洗

Scale AI公式 = 领域深度 × 工程严谨 × 质量可控 × 合规可信 × 规模弹性 → 让AI系统建立在可验证、可审计、可演进的数据基石之上。

实战:做一个3D小世界编辑器

现在,让我们回到Vibe Coding的主场。下面这段Prompt,就是用来生成一个完整的3D村庄编辑器的。

完整Prompt

text

我想做一个网页上的“3D小世界编辑器”,定位是“摆在桌子上的小模型”那种感觉,不是开放世界游戏。

【我想要的体验】
- 打开网页能看到一个8*8左右的世界,立刻能玩
- 鼠标点格子放东西(草地、土路、水、石头、树、房子、擦除,7个工具)
- 拖拽视角、滚轮缩放
- 鼠标悬停的格子有视角反馈
- 关闭网页,下次打开还在(本地持久化)
- 能切换3个不同的存档世界
- 一个“重置”按钮:程序化生成一个小村庄(有水塘、石堆、几栋房子、几棵树、连通的小路)
- 一个“清空”按钮:全部变草地
- 首次打开有个简短操作提示,几秒后自动淡出

【技术架构】
- 单页面,零构建:直接双击HTML就能打开
- 文件不超过3个:一个HTML、一个CSS、一个JS
- Three.js用CDN引入(r128版本),不要ES module,不要import map
- 不要React/Vue/TypeScript/Webpack
- 所有3D物体用Three.js内置几何体拼(Box、Cone、Cylinder等),不要外部模型

【视觉方向】
- “积木玩具”风:颜色饱和、对比明确
- 背景是奶油色(CSS处理),不做天空、不要地平线
- 光照要“日光”感,草地不要被照成发白
- 阴影要柔,不要硬切

【UI风格】
- 顶部:标题面板 + 存档面板(下拉选 + 重置 + 清空按钮)
- 底部居中:工具卡片栏(emoji图标 + 中文标签)
- 右下角:小地图(Canvas 2D),俯视显示当前世界
- 全部面板:浅色磨砂玻璃风格(半透明+模糊背景),圆角

【代码组织】
- HTML只放结构和引用
- CSS写所有外观
- JS包成IIFE,逻辑分段:场景/光照/数据/工厂/交互/持久化/小地图/启动
- 数据用 world[x][z] = { terrain, kind },所有写入唯一入口 setCell()

Prompt意图拆解

意图维度具体描述
核心玩法点格子放置,7种工具,8x8世界
交互方式拖拽旋转、滚轮缩放、悬停反馈
数据持久化localStorage,3个存档槽
程序化生成重置按钮生成小村庄(水塘+石堆+房子+树+小路)
视觉风格积木玩具风、奶油色背景、柔阴影
UI组件顶部存档面板 + 底部工具栏 + 右下小地图
技术约束纯Three.js,零构建,双击即用

Coding Agent:LLM不仅有脑子,还有手脚

这里要引入一个关键概念:Coding Agent

传统的LLM只负责生成代码,你需要手动复制粘贴、创建文件、运行调试。但现在,Cursor、Claude Code、Trae等工具让LLM不仅能思考,还能干活

  • 自动创建文件
  • 写入代码
  • 运行命令
  • 读取错误日志并自动修复

💡 Coding Agent = LLM(大脑) + 文件操作能力(手脚)

这意味着,你甚至不需要离开编辑器。一段Prompt → AI写代码 → AI创建文件 → AI调试 → 你验收。整个流程,你只需要“Vibe”一下。

关于本地算力:ollama与具身智能

说到AI的“手脚”,就不得不提本地大模型具身智能

ollama:本地大模型管理平台

ollama可以让你在本地安装和运行开源大模型,不依赖云端API。前提是你的芯片/显卡足够强大。

具身智能(Embodied AI)

当大模型不再局限于文本生成,而是与机器人结合——这就是具身智能。在工业4.0场景中:

  • 万兆宽带
  • 本地算力(黑盒子硬件)
  • 实时推理

AI不仅能写代码,还能在物理世界中行动。

行业思考:受限与高成本程序员的需求

为什么这类Prompt工程如此重要?

因为传统的软件开发存在一个巨大的供需鸿沟:

  • 受限的程序员:受限于技术栈、框架、构建工具
  • 高成本的人力:一个完整游戏编辑器需要前端+后端+3D+UI,传统开发成本极高

而AI Native思维解决了这个问题:

一段清晰的Prompt + 一个高级LLM = 原本需要多人团队数周的工作,压缩到几分钟。

总结:从Vibe Coding到AI Native

阶段能力产出
古法编程手敲语法+算法功能实现
Vibe CodingPrompt + 迭代单页应用(如生日贺卡)
AI NativePrompt + Coding Agent复杂系统(如3D游戏编辑器)

当你掌握了Prompt工程,再加上Coding Agent的“手脚”,你就可以:

  1. 用一段Prompt描述一个3D世界
  2. AI生成完整的HTML/CSS/JS代码
  3. 双击打开,立刻拥有一个迷你村庄编辑器
  4. 分享给朋友,他们也可以点格子搭自己的世界

🎯 这就是AI Native思维:不是用AI辅助开发,而是让AI成为开发者,你成为世界架构师。

写在最后

从生日贺卡到3D小世界,Prompt的复杂度在提升,但你的工作量并没有增加——你依然只需要清晰地描述你想要的东西。

剩下的,交给LLM和Coding Agent。

💡 试试看:把上面的Prompt复制到Claude或GPT-4里,然后说“帮我生成这个3D小世界编辑器”。

几分钟后,双击HTML文件,开始搭建你的第一个迷你村庄。

一人公司 + 3D世界 + 本地算力 = 下一个世代的创造方式