计算机视觉与AI在人体扫描技术中的应用

64 阅读5分钟

计算机视觉在人体扫描技术中的应用

通过某中心的健康服务,用户可以利用智能手机拍摄的照片测量体脂率,并通过个性化3D模型进行追踪。这种扫描水平通常只有昂贵复杂的设备才能实现,但该功能使其对任何拥有智能手机的用户开放。为实现这一目标,某中心科学家运用了计算机视觉、计算机图形学、人工智能和创造性问题解决的技术方案。

技术挑战与解决方案

科学和工程团队在开发该功能时面临两个主要挑战:首先是从智能手机照片中估算体脂率而无需其他直接测量;其次是创建用户身体的个性化3D模型。这两个问题的解决方案都结合了深度神经网络(能够通过识别大量数据中的模式来学习任务)以及计算机视觉和计算机图形学中的经典算法。

基于图像的体脂率估算

估算体脂率是一个复杂的过程。家用智能秤并不直接测量体脂,而是分析身体电阻并通过方程转换为体脂率。基于全天水分摄入的变化,这种电阻测量会产生很大波动,导致体脂率估算误差较高。

商业级测量工具(如水下称重和气动体积描记法)通过测量身体体积来转换为体脂率,比家用智能秤更准确,但需要专业设备且每次扫描都需要费用。双能X射线吸收测定法被认为是身体成分测量的临床金标准,但这些设备需要处方且每次扫描费用高达80美元。

"所有这些不同方法都试图通过间接测量来估算体脂率,"某中心首席科学家表示,"借鉴间接测量的思路,我们挑战自己构建一个计算机视觉系统,能够通过从图像中测量的视觉特征(如整体体型和身体细节,包括肌肉线条和脂肪褶皱)准确预测体脂率。"

技术实现方案

解决方案是开发一种利用卷积神经网络的技术,这是一种常用于分析图像的深度神经网络,以及半监督学习(一种在有限真实数据条件下训练模型的机器学习方法)。机器学习模型的输入是从智能手机拍摄的照片,输出是表示体脂率的数值。

为训练模型,通常需要收集不同扫描条件下许多用户的照片及其实际体脂率数据。问题在于使用双能X射线吸收测定法成本过高。因此,团队预训练了一个卷积神经网络来学习人体的表征,该网络能够从图像中提取区分性特征。网络分析图像中的整体体型和身体细节,提取与身体成分相关的视觉特征。然后使用实际双能X射线吸收测定法扫描数据通过半监督学习微调该网络。

3D头像生成技术

科学家们承担了开发能够从简单智能手机照片集生成客户身体3D虚拟表示工具的雄心勃勃目标。为实现这一目标,他们训练了一个深度神经网络,该网络从拍摄的照片中估计底层统计模型的形状和姿态参数。同样,关键挑战是获取训练模型所需的数据。

"你需要一个人的图像,以及同一时间捕获的同一个人的3D模型来训练这个模型。这将非常昂贵,因为你必须在许多具有不同种族、年龄、性别等变化的人身上捕获数据,"科学家解释道。

为解决这个问题,他们决定不构建端到端系统(直接从照片到3D头像),而是构建一个包含两个模块的系统。第一个模块从原始照片开始,通过将人物从背景中分割出来获得用户的轮廓,生成身体形状的黑白二维图像。第二个模块将轮廓图像转换为3D头像。在此阶段,团队决定使用合成数据代替昂贵的3D扫描。合成图像是使用图形渲染软件生成的,该软件利用3D模型生成相应的2D轮廓。然后他们使用这些合成示例来训练系统从轮廓预测3D模型。

隐私保护设计

隐私是该功能设计的基础。用于构建3D头像和测量体脂率的身体扫描图像在处理后会自动从云中删除,之后除非用户明确选择云备份,否则这些图像仅存在于客户手机上。

技术影响与未来展望

该功能最重要的突破之一是让人们能够轻松获取比身体质量指数更有用的健康指标。"医生们多年来都知道体脂率是比身体质量指数更好的指标,因为它能更好地预测心血管疾病甚至某些类型癌症的医疗风险,"资深应用科学经理表示,"这个问题在年龄增长时尤其重要。在那个阶段,体重减轻往往与肌肉质量减少相关,这通常不是好消息。"

团队知道他们仍然面临挑战,但表示他们不断寻求改进。"由于数据缺乏以及对临床准确性和隐私的高要求,为健康应用构建面向客户的产品本身就具有挑战性,"经理说,"通过基于深度学习、经典计算机视觉和计算机图形学的思想,我们解决了提供比生物阻抗秤等替代方案更高准确性的新产品中的困难挑战。我们非常兴奋能与客户分享这项技术,并将继续改进它,通过令人兴奋和有用的新功能持续取悦客户。"