在过去的五年里,人脸面部识别已经成为人工智能(AI)未来的竞争之地。这项有争议的技术概括了公众对不可避免的监控、算法偏见和人工“智障”的担忧。
在计算机视觉领域,有偏见的面部识别问题被解释为呼吁建立更具包容性的数据集和模型。我认为相反,研究人员应该批判性地询问计算机视觉不能或不应该识别的内容。
识别是计算机视觉中最古老的问题之一。对于该领域的研究人员来说,识别是一个检测和分类的问题。或者,正如《机器视觉》所述,“对象识别问题可以定义为基于已知对象模型的标记问题。”
当识别应用于人时,就变成了使用视觉属性来确定图像中描绘了什么样的人的问题。这是人脸识别 (FR) 和人脸面部分析 (FA) 的基础,人脸识别 (FR) 试图将一个人与其先前捕获的面部图像联系起来,人脸分析 (FA) 声称可以通过一张脸的图像,识别出差种族、性别、性取向或情绪等属性。
人工智能和机器学习 (ML) 研究(例如,卷积神经网络和深度学习)的最新进展在人脸识别和人脸分析模型的技术性能方面取得了巨大进步。这些性能改进开创了人脸识别的新时代,并在商业和机构领域广泛应用。然而,算法审计已经揭示了在对不同人口群体进行面部识别和分析任务时的表现差异,尤其是对于深色皮肤的女性来说准确度较低。
作为对这些审计的回应,机器学习社区中的公平、问责和透明度 (FAT) 已开始为模型训练和评估构建更大、更多样化的数据集,其中一些包括合成人脸。这些努力包括在这些照片中描绘的人不知情的情况下从互联网上抓取图像,导致一些人指出这些项目如何违反有关隐私和同意的道德规范。
创建多样化数据集的其他尝试甚至更令人不安,例如,当Google承包商向洛杉矶和亚特兰大的黑人无家可归者索取人脸面部扫描时,他们会得到 5 美元的星巴克礼品卡作为报酬。这些努力提醒我们,包容并不总是意味着公平。他们还提出了一个问题,即研究人员是否应该收集更多关于已经受到严密监控的人的数据,以便构建可用于进一步监控他们的工具。这与 Keeanga-Yamahtta Taylor 所说的掠夺性包容有关,即所谓的包容性计划对边缘化人群(尤其是黑人社区)造成的危害大于好处。
公平、问责和透明度社区的其他工作试图通过设计新的数据采样策略来解决有偏见的人脸识别和不平衡的问题,这些策略要么对少数人口统计数据进行过采样,要么对大多数人进行过采样。
另一种方法是创建“偏见感知”系统,该系统学习种族和性别等属性以提高模型性能。 这些系统首先从图像中提取人口统计特征,然后将其用作面部识别任务的明确线索。 简而言之:他们首先尝试检测一个人的种族和/或性别,然后使用该信息使面部识别更好地工作。 然而,这些方法都没有质疑这样的基本前提,即种族、性别和性取向等社会类别是可以仅基于视觉线索识别的固定属性——或者为什么在我们的社会中需要对这些属性进行自动识别。
这个问题的症结在于身份和外表之间的微妙交集。例如,种族是一个与表型相关但不等同的社会类别。因为种族不是客观或自然的描述,所以不可能根据他们的形象明确地识别出一个人的种族,任何这样做的尝试都会很快转向科学种族主义的领域。同样,虽然性别的表现往往包括某种刻意的审美自我呈现,但仅凭外表是无法辨别的。视觉线索可以暗示某个社交群体中的成员身份,但它们并没有定义它。
相比之下,在社会科学和许多激进主义空间中,认可被理解为一种源自共同历史和身份的社会过程。正如哲学家格奥尔格·黑格尔(Georg Hegel)所描述的那样,承认是相互的和主体间的。我们通过被他人认可来发展和肯定我们的身份感。此外,社会认可是持续的,因为人们不是固定的,我们彼此之间的关系也不是固定的。
同时,在计算机视觉领域,识别始终是片面的视觉评估。此外,计算机视觉的分类方法通常会强加相互排斥的类别——你只能属于一个——而从社会角度来看,我们将身份视为多重和交叉的,某些特征如性别或性取向存在于某种光谱中。当面部分析系统分配一个与一个人的自我身份相矛盾的标签时——例如,当将一个人归类为错误的性别时——这可能是一种有害的错误识别形式。
相比之下,社会认可就像是一种肯定的点头,说我看你就像你看自己一样。 或者,正如斯图尔特·霍尔 (Stuart Hall) 所说,共享身份建立在“对某些共同起源或与另一个人或团体或一个理想的共同特征的认识,以及建立在此基础上的团结和效忠的自然关闭”。
归根结底,任何计算机视觉项目都基于这样一个前提,即一个人的外表可以告诉我们一些关于他们内心的明确信息。这些系统完全基于外观,而不是身份、团结或归属感。虽然面部识别可能看起来很未来,但这项技术从根本上是向后看的,因为它的功能取决于过去的自我形象和过时的人分类方式。 展望未来,与其问如何使人脸识别更好,或许问题应该是:我们希望如何被识别?
拓展阅读
人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒的生物识别技术,具有极其广阔的市场应用前景。在公安、国防、海关、交通、金融、社保、医疗及其他民用安全控制等行业和部门存在着广泛的需求。
我们TSINGSEE青犀视频的研发人员近期也在积极开发人脸检测、人脸识别、人流量统计、安全帽检测等AI技术,并积极融入到现有的视频平台中。典型的示例如EasyCVR视频融合云服务,具有AI人脸识别、车牌识别、语音对讲、云台控制、声光告警、监控视频分析与数据汇总的能力,广泛应用在小区、楼宇的智能门禁,周界可疑人员徘徊检测、景区人流量统计等场景中。