人脸识别新工具：数据少也能认识“国际脸” 卷诚一郎

　日前，亚马逊的一款人脸识别工具错误地将28位美国国会议员与罪犯相匹配，这一新闻引发关注。人脸识别工具为何出现这样的错误？其实，机器与人类一样，见到陌生的外国人也会有“脸盲”，只能识别“当地人”，对于来自其他国家/地区的“外地人”识别精度较低，这一问题如何解决呢？

　　引用公开的个人信息进行研究与验证邓伟洪团队供图

　　研究团队在讨论邓伟洪团队供图

　　其关键在于让人脸识别工具尽量多地认识全球各地居民的脸，而这一过程却并不容易实现。北京邮电大学教授邓伟洪告诉《中国科学报》，人脸识别工具研发过程中，使用的训练数据越多、越齐全，精度就会越高。但由于不同国家/地区对公民个人信息的保护，这些信息收集越来越难。没有训练数据就意味着人脸识别工具只认识“熟人”，而对于训练数据中缺失的人群的识别精度较低。

　　近日，邓伟洪研究团队的一项研究获得新进展，该团队揭示了当前人脸识别算法中普遍存在跨国家/地区识别偏差问题，构建了评价偏差程度的人脸数据集RFW，提出了减小识别偏差的信息最大化自适应神经网络，以改进对目标域的识别能力。10月27日，相关研究结果在由IEEE主办的国际计算机视觉大会（ICCV）上发表。

　　人脸识别工具的地域之困

　　卷积神经网络是人工智能的代表算法之一，具有很强的图像表征学习能力。2012年，深度卷积神经网络在计算机视觉领域兴起，其出现极大地推进了人脸识别的发展，并成为人脸识别领域的主流技术。

　　目前，全球的人脸识别工具大多根据深度卷积神经网络的技术开发，但该技术的人脸数据的源域基于西方人的面部特征，面对不同的目标域，即不同国家/地区居民的面部信息识别需求往往“力不从心”。

　　邓伟洪表示，由于缺乏基准测试库，这一领域的研究长期进展缓慢。一款人脸识别工具即使在当地的识别率很高，也难以精准到全球人类。这就造成了人脸识别工具较强的地域性。

　　为了推动该研究，邓伟洪研究团队构建了一个新的测试库——RFW，以科学客观地评测人脸识别中的偏差。

　　在RFW数据库的基础上，研究人员验证了微软、亚马逊、百度、旷视的商业API和学术界最先进的4个算法。

　　“这种识别的偏差确实存在，一些地区的错误率甚至高于西方国家的两倍。”邓伟洪说。

　　该论文的评审专家表示，RFW与现有数据库相比，该数据库中的数据分布更均匀，这将成为跨国家/地区识别的一个较好的基准评价数据。

　　为了探究这种偏差是否是由训练数据的分布不平衡引起的，研究人员收集了一个涵盖全球各地区人类信息的训练数据库，最终发现偏差的发生受到数据和算法两方面影响。

　　该论文第一作者、北京邮电大学博士生王玫解释，数据库训练数据平衡、算法相同，但某些国家/地区人类的面部信息识别难度较大，导致识别准确率较低。

　　如何在数据少、面部识别难的情况下提高识别率？研究人员并没有放弃，他们决定进一步的研究算法，借助算法让人脸识别工具举一反三。

　　学习靠“自觉”

　　传统机器学习数据库搭建过程中需要人工标注个人信息，这一操作面临隐私泄露的风险。用于物体识别的无监督域自适应方法给了研究人员启发。

　　该方法采用无监督学习的方式，将源域和目标域映射到域不变的特征空间，并提高目标域性能。研究人员想通过算法解决这一问题，让机器自行学习。

　　“这就相当于研究人员把试卷出好，机器作答。”邓伟洪说。

　　实现并不简单，在具体操作层面，物体识别不同于人脸识别。物体识别的源域和目标域可以重叠，且信息获取相对便宜，充足的源域数据使识别工具能够区分和判别目标域信息。

　　因此，研究人员提出了一种信息最大化自适应网络。王玫介绍，该方法一方面减小源域和目标域的全局分布差异，另一方面能够学习有区分性的目标域特征。

　　“也就是说，卷积神经网络可以在无监督的情况下，‘自觉’地学习目标域人脸的特征。”王玫说。

　　为了解决两个域之间类别不重叠的问题，信息最大化自适应网络采用谱聚类算法生成“伪标签”，并在监督下利用伪标签对网络进行预适应，初步提高目标域的性能。

　　这种聚类方案与其他不适用于人脸识别的域自适应方法有着本质区别。王玫解释，新方法可以在全新的目标域上自主学习，不需要人工干预，避免了隐私泄露的风险。

　　为了进一步提高网络输出的鉴别性，研究人员还提出了一种新的基于互信息的自适应方法，它以无监督的方式在目标域的特征之间产生更大的间距。

　　与一般的有监督的损失和有监督的互信息不同，该方法具有无监督的特性，其可以利用所有无标签的目标域数据，无论这些数据是否被成功地分配了伪标签。

　　基于公开数据进行验证

　　这套方案是否能在非监督的情况下，提高人脸识别工具对不同国家/地区居民脸部信息的识别率呢？

　　研究人员采用全球各地名人的公开数据进行验证。结果表明，信息最大化自适应网络可以成功地将识别能力从源域应用到其他国家/地区的目标域人群中，且识别性能优于其他域自适应方法。消融实验研究发现，互信息损失对减少识别偏差有重要作用。

　　王玫补充，信息最大化自适应网络在跨姿态、跨场景的应用上也有很好的泛化性能。

　　鉴于较好的实验结果，研究团队已经对外发布RFW数据集，以推进研究进一步深入。

　　目前，已有哈佛大学、帝国理工学院、清华大学、思科、华为、NEC、IBM等20多个国家的科研院所、企业的科研团队申请使用RFW进行多人种人脸识别研究。

　　值得一提的是，该方法在进行自适应学习的同时，仍然需要利用源域地区采集的标注数据对模型进行训练。这就意味源域数据具有隐私泄露风险。如何在源域数据不外传的情况下进行目标域的自适应学习，将是非常值得研究的问题。

　　邓伟洪表示，下一步希望在完全不采集目标域数据的情况下，提出具有更强泛化能力的新算法，直接提高人脸识别工具在未知目标域的准确率。