必贝yo告诉你为什么面部识别系统识别深色人脸时出错率更高
面部识别系统流行于九十年代早期,当时美国国防部希望发明一种可以发现偷渡边境的不法分子的识别技术,为此投入了大量研究。为此,美国国防部为著名的大学科学家和面部识别领域的专家提供了研究经费。为此,美国国防部为著名的大学科学家和面部识别领域的专家提供了研究经费
2001年初,在坦帕(Tampa)举行的第35届超级碗(Super Bowl)比赛中,执法部门首次在公共场所使用面部识别技术,在数千名观众中搜寻罪犯和恐怖分子。不久之后,美国的其他敏感地区也安装了面部识别系统,以跟踪犯罪活动。
然而,美国政府的研究却表明,即使是最先进的面部识别系统在识别黑人时的错误率也要比识别白人时高出十倍。
即便是最先进的算法,在检测黑人时还是更容易出错
法国公司Idemia的面部识别算法被用于识别数以百万的人脸。美国、澳大利亚和法国的警方都是这家公司的客户。Idemia的软件被用于识别曾在美国海关和边境保护局留下负面记录的旅客。2017年,一位FBI高层在向报告国会的报告中称扫描了三千多万人脸的Idemia技术对“保护美国人民的安全”大有帮助。
然而,Idemia的算法并不能总是公平清晰地对所有面部进行精准识别。美国国家标准技术研究所(National Institute of Standards and Technolog, 简称NIST)的测试结果表明,相较于白人男性和女性,即便是Idemia最先进的算法,在检测黑人时还是更容易出错。
NIST利用同一个人的两张照片对算法进行了测试,过程类似海关工作人员查验护照的流程。在敏感性上,Idemia的算法识别白人女性人脸的出错率是万分之一,识别黑人女性人脸的出错率则是千分之一——比前者高了十倍。
而万分之一的出错率通常是被用于评估评价面部识别系统的标准。
美国公共安全部在Idemia的负责人Donnie Scott表示,NIST所测试的算法并未投入商用,并且,公司在产品开发的过程中会进一步检测人口差异。他认为,(测试白人和黑人时)结果上的差异性,很可能是由于开发测试工程师在测试过程中一味追求接近NIST期待的正确率,“人与人之间有生理差距,但算法会在识别不同人群方面取得进步”。
计算机视觉算法从未在识别人脸上表现得如此出色。NIST去年表示,在2010年至2018年间,最好的算法在大型数据库中找到一个人的能力提高了25倍,只有0.2%的情况下没有找到真正匹配的人。这使得面部识别算法得以被投入大范围的使用,包括政界、商界以及手机应用(如苹果的面部识别解锁)。
然而,包括NIST的测试,以及其他的各类调查研究都表明,算法在识别深肤色人群时更容易出错。
在调查了50多家相关公司之后,NIST在七月的报告中指出,很多面部识别方面的顶级公司算法都有和Idemia类似的“识别黑人时出错率高十倍”的问题。
NIST发布了自2017年初以来的面部识别系统人口测试统计调查报告结果,除了人种问题,该机构还发现系统在识别女性上比男性更加困难,部分观点认为是女性化妆所致。
报告表明,白人男性在人口统计结果上识别错误率(false match rate, FMR)最低,而黑人女性FMR为最高。
NIST计划在今年秋天发布另一详细报告,将对面部识别技术在面对不同人口族群时的性能测试结果做出详细阐述。NIST的研究被认为是评估面部识别算法的最高标准,所以在报道中获得高评价的公司可以获得强大的背书。
Idemia 在今年三月份举行的发布会上表明,比起同类产品,在服务美国联邦政府客户上,该公司的软件表现更佳。
相较白人面孔,许多面部识别算法更容易混淆黑人面孔。每个图表都代表了NIST测试的一种不同算法。图表最上方的红色实线表明,算法对于黑人女性人脸的错误率高于其他种族。
美国国土安全部(DHS) 同样发现识别深色皮肤人群是商用面部识别系统面临的一项大挑战。二月,DHS发布了十一家被用于识别身份的商用面部识别系统的调查结果,结果表明系统的表现和肤色相关,系统通常需要更长的时间来处理皮肤较深的人,而且识别它们的准确性较低
必贝yo云数据(www.bbeyo.com),作为国内基于大数据方面的数据积累、数据分析和标签归类人工智能AI技术驱动的大数据交易平台,支持海量数据的分布式采集、计算及处理,从而以机器学习推动数据交易发展,让数据价值最大化。互联网开放数据、企业内部数据接入,清洗、过滤、脱敏处理后再交易,以数据和算法规则等形态沉淀在数据交易平台,满足企业对数据分析、数据运营及精准营销等方面的需求。互联网开放数据、企业内部数据接入,清洗、过滤、脱敏处理后再交易,以数据和算法规则等形态沉垫,实现企业和政府的数字化转型。联系电话:0351-6106588,0351-6106599,公司邮箱[email protected],
公司地址:太原市小店区东中环南段259号亲海国际1幢A座24层2422号,山西奇畅飞科技有限公司
为什么面部识别系统识别深色人脸时出错率更高
为什么面部识别系统在辨别有较深肤色的人脸时出错率较高的原因仍不明确。Boulamwini 告知国会,企业所使用的训练面部识别系统的数据库也许并不具有足够的代表性。最简单且能收集到大量人脸数据的地方是网络,而网络上充斥着西方的、白人的、男性的面部图像。IBM的一篇评论文章指出,最经常被学术研究所引用的的三个人脸数据库中,有高于百分之八十一的人有着浅色的皮肤。
而负责NIST的测试,在面部识别领域广为人知的Patrick Grother表明还有其他原因也会造成系统识别深色皮肤变得更加困难,其一便是照片质量。从彩色胶片时代到数码时代,照相技术一直都会优化肤色较浅的人拍出的图像。在十一月的一个会议上,他还指出了另外一个具有挑衅性的假设——黑人的面部趋向于有更高的相似性。“在基因学上,不同的种族在外观上会有不同。”
佛罗里达理工学院的副教授Michael King则无法对此表达确定:“这一点问题我们还没办法进行讨论。因为我们的研究还没有进行到那一步。”这位研究者此前曾为美国情报部门做过包括面部识别技术的相关工作。
King的最新研究与FIT以及圣母大学的研究者合作,调查了面部识别系统在面对不同种族时的差异性,并对此提出了解决方案。
他们的研究用53000张犯罪档案照片测试了包括两个商用和两个开源系统在内的四个面部识别系统。结果表明,将一个人认成另一个人的识别错误对于黑人来讲更加普遍,而对于白人人脸来说无法识别系统中已有的犯罪者的资料的几率更大。相比起白人,无法达到ID照片标准的黑人的照片数量更多,但只凭这一点无法解释系统偏差。
只有变更灵敏度设定才能让测试结果一样
研究者们发现,只有变更灵敏度设定才能使得白人和黑人的测试结果一样。但是这一操作方法不太可能在实验室外实施,因为让警探在面对不同种族的对象时使用不同的敏感度设定本身就有歧视的危险,并且可能会导致种族问题上的官司纠纷。
当King和其他研究者认真地在实验室里探寻算法的秘密时,关于面部识别技术的政治斗争正在紧凑进行着。考虑到该技术在对象为少数族群时的出错率,两党的国会议员都作出了会限制面部识别技术使用的承诺。本周二,奥克兰成为了继萨默维尔,马萨诸塞和旧金山之后第三个禁止其公共机关使用面部识别技术的美国城市。而King表示,使得面部识别技术能够公平地识别所有种族对象的研究会按照自己的步调进行。他说“使得系统在处理所有种族时的正确率一致,或者是发掘这种可能性,都会是一个长期的目标”。