VSLAM 算法的输入分析(二)

243 阅读3分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第2天,点击查看活动详情

VSLAM 算法中的图像输入部分是将现实世界和 AI 模型连接起来的关键通道。但是对于一个程序而言,如何将物理世界的光学图像转化为二进制的计算机可以处理的信息呢?

现实侧与模型侧的对接

现实世界的图像如何对接到计算机呢?换句话说,现实世界的信息如何转换为二进制代码呢?

电器设备需要接通电源使用,电脑程序在运行过程中控制的是高低电平的变化,通常 3.3 V 以上为高电平,3.3 V 以下为低电平。

高低电平对应硬件(电路板)、0101的二进制程序对应软件(操作系统),通过高低电平和二进制的一一对应,建立起了软硬件之间的联系。

相机通过成像原理将光信号转换为数据电信号,再通过数据传输线传给处理机,变成0101的二进制数据供程序使用。这就是将物理世界的图像数据转换为模型可以接受的二进制数据的原理。

那现在有一个问题,就是相机如何和模型进行对接的方案是什么?我认为有两个方案。 1)单独运作,相机先获取数据并保存到特定路径下,应用再从路径下输入对应数据;2)相机直接对接程序,一边摄像一边处理;(对于从零至一的初步的模型开发,可以先实现方案一,以后再支持方案二。)

现实侧的相机参数

现实世界中选择相机的步骤称为相机选型,一个单目相机的参数一般有以下几项:

  • 型号
  • 类型
  • 最大图像尺寸:如 1920✖1080(实际使用中可以截取更小尺寸,以避免边缘端失真)
  • 帧率:如 50Hz,225fps
  • 镜头:如 2.8 mm,水平视角场:98°
  • 支持协议:如 TCP/IP,ICMP,HTTP,FTP,802.1X 等
  • 接口协议:如 ONVIF
  • 通讯接口:如 1 个 RJ4510M/100M 自适应以太网接口
  • 电源
  • 相机尺寸:如 φ127×97.5
  • 相机重量

对于模型侧而言,相机重量和电源等参数显然无关紧要,只需要确保分辨率、模式和帧率等参数足够就好。

VSLAM 中一个重要分支就是基于单目相机的定位建模算法,进行单目相机的选型时可以参考泡泡机器人曾经发布的一篇文章VSLAM之单目相机选型_leather_wang的博客-CSDN博客_vslam相机,当中介绍了如 Pixel size、Optical format、active imager size和镜头等关键参数的含义,并科普了相机成像的科学原理。