概述
计算机辅助设计系统是设计日常物理对象的成熟工具,但掌握它需要专业知识。为使设计对非专业人士更快捷易用,MIT等机构的研究人员开发了一种AI驱动的机器人装配系统,允许人们通过语言描述来构建实体物体。
核心技术
该系统的工作流程如下:
- 文本转3D几何:首先,一个生成式AI模型根据用户的文本提示(如“给我做一把椅子”)构建物体几何形状的3D网格表示。
- 智能组件布局:接着,第二个生成式AI模型,即视觉语言模型,根据物体的功能和几何形状,推理并确定不同预制组件(如结构件和面板件)的装配位置。该模型充当了机器人的“眼睛和大脑”,理解座椅和靠背需要面板来提供支撑表面。
- 人机协同设计:用户可以通过新的文本提示(如“只在靠背上使用面板,座位不要”)在整个过程中参与设计迭代,系统会根据反馈调整最终设计。研究人员认为,这种人在回路的方式能更好地满足用户的个性化偏好。
- 机器人自动装配:最终确定的3D网格设计会被传递给一个机器人装配系统,该系统使用可重复使用的预制部件自动构建出实体物体。这些部件可以随时拆卸和重新组装,减少了制造过程中的浪费。
实验与评估
研究人员使用该系统制造了椅子和架子等家具。通过用户研究评估发现,与其他方法相比,超过90%的参与者更偏好他们AI驱动系统制造的物体设计。
研究还发现,视觉语言模型能够在一定程度上理解椅子的功能性(如倚靠、就坐),从而决定面板的放置位置,而非随机分配。
未来展望
目前这项工作是初步演示,但该框架对于航空航天部件、建筑构件等复杂物体的快速原型制造可能特别有用。长远来看,它有望应用于家庭环境,用于本地制造家具或其他物品,从而减少中心化工厂运输笨重产品的需求。未来,研究人员希望增强系统以处理更复杂的提示(如“用玻璃和金属做的桌子”),并集成齿轮、铰链等更多预制组件,以实现更丰富的功能。FINISHED