深度之眼cv项目就业小班学习

126 阅读3分钟

通过虚拟现实引擎,可以更好地创建训练数据。在精度上,模型的输出已经达到了现实世界的标准。意味着可以通过模型生成智能数据来指导计算机视觉模型的学习。这种合成数据可以成为以数据为中心的人工智能框架的基础。

因此,我认为现在有必要广泛使用可视化合成数据。

虚拟现实引擎有专门的生成合成数据的组件(比如 NVIDIA IsaacSim,Unity Perception),这些合成数据不仅美观,而且有助于训练更好的算法。

3D 功能正迅速成为一种必需品——最新的 iPhone 手机就配备了激光雷达(LiDAR)和用于 3D 扫描的应用程序,来达到更好的性能。

元宇宙(Metaverse)的时代即将开始。人们将会渐渐习惯生活在虚拟现实的世界中。比如未来的宝马制造厂和谷歌的孪生供应链,就会应用到数字孪生技术。行业的领头者已经开始使用虚拟现实技术来改进计算机视觉算法:特斯拉(Tesla)就在利用虚拟现实技术来生成驾驶场景的边缘情况和更多的新视角。

如果我们有合适的工具来建立数据集,我们就可以省去手动标记数据的繁琐过程,更好地开发和训练计算机视觉算法。Gartner认为,未来三年,合成数据将比真实数据更占优势。

如果我们向前迈一步呢?进入一个计算机视觉不需要人类标记图像的世界。

通过合成计算机视觉,我们可以在虚拟现实中建立模型,并在现实世界中部署它们。就像在国际象棋比赛中,AlphaZero可以自己学习重要的部分,所以我们用算法来决定模型需要学习什么,才能达到最好的学习效果。

在合成计算机视觉(SCV)中,我们使用虚拟现实引擎来训练计算机视觉模型,并将训练好的模型部署到现实世界中。

人眼能看到的远不如现实世界丰富,所以我们构建的算法只能达到人类能理解和标记的信息范围。但事实可能并非如此,因此我们可以为传感器构建算法,以测量人类感知范围之外的事物。这些算法可以通过虚拟现实中的编程进行有效训练。

与其建立更大的模型,用更多的计算能力去解决问题,我们还不如获得更好的对算法学习有帮助的数据。算法的学习不需要相同类型的数据,而是各种不同的数据。

《深度心灵》显示,AlphaZero只是一个开始,他们已经将同样的方法应用到围棋、星际争霸和蛋白质折叠中。现在我们已经拥有了为计算机视觉构建一个类似AlphaZero的系统的所有必要组件,这样它就不会受到人类设计输入的限制,可以自我学习。该系统可以创建和操作虚拟场景,并通过自学解决视觉自动化的任务。

合成计算机视觉是基于合成数据的。前期大概有30家左右的公司开始了可视化合成数据生成的业务。一些公司专注于一个垂直领域的特定用例,而大多数公司同时在多个垂直领域进行。