Niantic Spatial 旨在绘制 AI 无法触及的 80% 物理经济版图

3 阅读7分钟

\n\nNiantic Spatial 推出 Scaniverse 商业版,利用空间智能技术构建大型地理空间模型。其目标是为占据全球经济 80% 的线下实物经济建模,使机器能理解并与物理世界交互。

译自:Niantic Spatial wants to map the 80% of the economy AI can't see

作者:Adrian Bridgwater

到目前为止,我们大体上都熟悉了大语言模型 (LLMs) 以及文本在预测性、生成性和代理性 AI 服务中的核心用途。随着自动化智能服务的多元化,我们的注意力正转向大型图像/视觉模型、大型音频模型以及新兴的视频生成模型领域。

该领域的下一个前沿可能是业界所谓的“空间智能”——即能够理解物理环境并对其进行推理,而不仅仅是处理文本或图像的 AI 系统。一种新兴的方法是“大型地理空间模型” (LGM),这是一种建立在 3D 扫描、卫星图像、激光雷达 (LIDAR) 和 GPS 数据之上的基础模型,旨在创建几何精确、机器可读的真实空间表示,开发人员可以在此基础上构建分层服务。

空间智能的门户

物理世界地图专家 Niantic Spatial 希望成为创建世界活模型竞赛中的先行者,并使其成为人类和机器可以对话的模型。本周二,该公司推出了面向企业的 Scaniverse,这是一款旨在作为空间智能服务门户的软件服务。

如果我们承认构建任何 AI 都很困难,那么为什么这个领域的地理空间制图和模型开发如此艰巨?

图片来源:Niantic Spatial

不要用文本来绘制世界

Niantic Spatial 解释说,问题源于迄今为止构建世界模型的方式,即大多数模型是基于文本和图像训练的。该公司致力于通过使用能生成具有精确坐标和几何形状模型的技术来提升这一实践,使环境变得可导航且机器可读。

但是,考虑到已经存在丰富的世界地图和地形数据集,这一切真的重要吗?作为 Niantic Spatial 的执行主席,John Hanke 认为数字经济仅占全球经济活动的一小部分,而专门建立在文本和图像之上的 AI 无法触及剩余部分。

“全球经济中只有 20% 是在线的,而另外 80% 则不是 [...] 那些提取、提炼、生长、组装、组合和运输原子的行为——正是这些原子让我们温暖、为我们提供住所、供养我们,并从总体上使人类的生存成为可能。” —— John Hanke,Niantic Spatial。

未数字化:全球经济的 80%

在公司自己的博客频道上,John Hanke 建议全球经济中多达 80% 的部分发生在数字屏幕之外,且大多缺乏数字编码。

“全球经济中只有 20% 是在线的,而另外 80% 则不是,” John Hanke 写道。“在现实世界中,在能源、农业、制造业、建筑业、运输业和物流业等行业——换句话说,提取、提炼、生长、组装、组合和运输原子的行为。这些是我们人类最基本的需求,而不是聊天机器人。”

John Hanke 及其团队主张,仅仅捕捉一个空间进行数字编码,与准确知道你在其中的位置,是两个不同的问题;他说,该领域的多数公司只解决了这两个向量中的一个。Niantic Spatial 旨在通过创建几何精确且具有空间基础的模型来同时解决这两个问题,使机器能够理解物理世界并与之互动。

高斯泼溅中的照片级真实感

Scaniverse 支持对物理空间进行多功能采集,范围从单个房间到数千平方米的区域。该软件旨在驱动一个集成的 Web 和移动平台,捕捉 3D 空间(无论大小),支持多种设备,以生成视觉定位地图和网格。在需要时,该技术还会生成高斯泼溅 (Gaussian splats),这是一种基于点的 3D 渲染服务,利用重叠技术创建完全照片级真实的数字场景。

面向企业的 Scaniverse 是一个自服务平台,允许任何团队使用智能手机或 360° 全景相机捕捉并重建真实环境(从建筑工地、仓库到工业设施,甚至是水下)。随后,它会生成机器人和 AI 代理在物理世界导航所需的空间地图。

Niantic Spatial 的 VPS 2.0 服务是该公司新的视觉定位系统,在已建模的环境中提供接近厘米级的定位,并在 GPS 失效的广泛区域提供可靠定位。在用 Scaniverse 绘制的地方,VPS 提供接近 6DoF 的定位。在其他地方,它能纠正 GPS 误差和信号中断,提供改进的、可靠的定位和航向,特别是在 GPS 信号较差的环境中。

地球观测与 GIS

总部位于英国剑桥的专业地理空间 AI 服务机构 Lampata 的创始人兼工程总监 Dean Summers 正是在这一领域工作。Dean Summers 告诉 The New Stack,到目前为止,AI 行业一直严重关注语言,但下一个真正的飞跃将来自于理解世界实际存在方式(空间化和动态化)的系统。

“建立在地球观测 (EO)、GIS 和地理空间数据之上的基础模型是合乎逻辑的下一步,因为它们允许机器对环境、资产和随时间的变化进行推理,而不仅仅是页面上的文字,” Dean Summers 说。“这是 AI 开始超越对话,进入对物理世界运行理解的阶段。”

他进一步解释说,随着我们进入地球数据测绘的下一阶段,现在的真正挑战在于跨“根本不同的地理空间数据”(即从向量和栅格到点云和传感器流)进行模型集成和训练。关键在于将这种复杂性转化为有意义、可靠的结果。

为了梳理当前的挑战和技术差距,Dean Summers 及其团队正与 OpenUK 内部的一个更大团体合作,创建一个技术雷达,勾勒出空间领域未来创新的图景。

一个 SDK,全平台覆盖

Niantic Spatial 即将于 2026 年 4 月推出 Niantic Spatial 开发工具包 (NSDK) 4.0,这是一个适用于 Unity、Swift、Android 和 ROS 2 的统一 SDK,直接连接到 Scaniverse 和 VPS 2.0。Scaniverse 可在普通的消费级手机上运行,现在还支持 360° 全景相机的数据,无需昂贵的专用设备或培训。今年晚些时候还将支持新型的数据采集和格式。

在移动端,新更新的 Scaniverse 应用程序建立在一个已被用于扫描现实世界中数百万个物体和地点的平台之上。多个用户可以在不同时间、使用不同设备为一个共享项目贡献扫描数据。上传的内容在云端存储和管理,融合为一个统一的模型,并随着新扫描数据的加入而更新。

Scaniverse 也可以通过该机构的浏览器门户在 Web 上使用。用户可以上传、管理和处理来自 Scaniverse 移动端应用和 360° 全景相机的数据,并直接在查看器中可视化输出结果。端 工智能