AI Native 思维下的3D小世界:从Prompt到LLM原理

3 阅读4分钟

一、需求:一个“摆在桌上”的3D小村庄编辑器

我想做一个网页上的“3D小世界编辑器”,定位是“摆在桌子上的小模型”那种感觉,不是开放世界游戏。具体体验包括:

  • 一打开网页就能看到一个 8×8 左右的世界,立刻能玩
  • 鼠标点格子放东西:草地、土路、水、石头、树、房子、擦除——共7个工具
  • 拖拽转视角、滚轮缩放
  • 鼠标悬停在格子上有视觉反馈
  • 关闭网页,下次打开存档还在(localStorage)
  • 能切换 3个不同的存档世界
  • 一个  “重置”按钮:程序化生成一个小村庄(水塘、石堆、几栋房子、几棵树、连通的小路)
  • 一个  “清空”按钮:全部变草地
  • 首次打开有个简短操作提示(“拖拽旋转、滚轮缩放、点击放置”),几秒后自动淡出

二、技术架构(纯前端,零构建)

为了实现上述需求,技术栈必须足够轻量、无依赖、开箱即用:

  • 单页面:直接双击 index.html 就能运行
  • 文件不超过 3 个index.htmlstyle.cssmain.js
  • Three.js 用 CDN 引入(r128 版本),不要 ES module、不要 import map、不要 npm
  • 不要 React / Vue / TypeScript / Webpack / Vite / OrbitControls
  • 所有 3D 物体 用 Three.js 内置几何体(Box、Cone、Cylinder、Icosahedron 等)拼成,不用外部模型或贴图

三、视觉方向:“积木玩具”风

  • 颜色柔和,对比明确
  • 背景是奶油色或米色(CSS 处理,不是 Three.js 的天空),不做天空、不做地平线
  • 光照要“日光感”而不是“演播厅白炽灯”,地面不会被照得发白
  • 阴影柔和,不要硬切

四、代码组织规范

  • HTML 只放结构和引用
  • CSS 写所有外观
  • JS 包成 IIFE,逻辑分段:场景 / 光照 / 数据 / 工厂 / 交互 / 持久化 / 小地图 / 启动,用注释分隔
  • 数据用 world[x][z] = { terrain, kind },所有写入走唯一入口(比如 setCell

五、为什么这类需求需要“AI Native 思维”?

传统开发中,一个具备完整交互、3D渲染、数据持久化、多存档的编辑器,需要数天工作量。而通过大模型(LLM) 生成代码,你只需写好 Prompt(如上所示),AI 就能直接输出可运行的 HTML/CSS/JS 文件。

5.1 行业痛点:高成本程序员 vs 大量未被满足的长尾需求

很多小团队、独立创作者、产品经理,有一个“小工具”想法,但因为开发成本高、排期长,最终无法落地。AI Native 思维的核心是:用自然语言描述需求,让 LLM 直接生成可工作的产物,极大降低从“想法”到“原型”的门槛。

5.2 AIGC 与 Coding Agent

  • 豆包等模型可以生成简单代码,但复杂任务需要更高级的模型
  • Cursor / Claude Code / Trae 等 Coding Agent,让 LLM 不只能生成代码,还能直接操作文件系统(创建文件、写入代码),做到“不用离开编辑器,LLM 帮你干活”

六、LLM 大模型基础

LLM(Large Language Model,大语言模型)是依托海量数据训练、参数量庞大的深度神经网络模型(DNN),具备逻辑推理与内容生成能力(包括生成代码),可适配多类复杂智能任务。

  • 数据来源:微软 75 亿美金收购 GitHub,Meta 收购 Scale AI(数据标注/清洗)48% 股份等,都说明高质量训练数据的重要性

6.1 参数规模示例(以 DeepSeek 为例)

  • deepseek-v4-pro(贵):1.6 万亿(1600B)
  • deepseek-v4-flash(性价比高):2840 亿(284B)
  • 且已适配华为芯片

6.2 Ollama:本地大模型管理平台

Ollama 可以让你在本地安装开源大模型(需要芯片/显卡支持),应用于具身智能、工业 4.0、本地算力场景(例如理想 L 系列汽车中的本地语音助手)。

6.3 大模型的数学本质

大模型就是一个由海量权重 参数 构建的 概率映射函数

数学表达:

text

y = f_θ(x)
  • x:输入文本向量(Prompt 输入)
  • y:输出文本序列
  • θ:全部模型参数(权重)
  • f_θ:大模型映射函数
  • 整个函数通过神经网络运算,从输入得到输出

简单理解:你给模型一段话(x),模型内部通过数百亿甚至万亿级别的参数进行复杂计算,最终输出一段合理的回答或代码(y)。

七、总结

通过一个清晰、结构化的 Prompt,你可以在几分钟内让大模型生成一个完整的“3D 小世界编辑器”网页。这个过程体现了 AI Native 思维:需求 → Prompt → 生成 → 运行。而背后的 LLM,本质上是一个巨大的参数化函数,通过海量数据训练获得生成能力。

未来,随着本地模型(如 Ollama)和 Coding Agent 的普及,每个人都可以拥有一个“虚拟程序员”,像搭积木一样搭建自己的数字世界。