人脸识别是计算机视觉中最大的研究领域之一。许多公司已经投资于人脸识别技术的研发。
人脸识别是计算机视觉最大的研究领域之一。现在,我们可以使用面部识别来解锁手机,验证安全门上的身份,并在一些国家进行面部刷洗支付。许多公司都投资于人脸识别技术的研发。本文将重点介绍其中的一些研究,并介绍五篇关于人脸识别的机器学习论文。
1. 大规模多模式人脸反欺诈的数据集和基准
随着大量的实际应用,人脸识别技术变得越来越重要。从智能手机解锁到人脸验证支付方式,人脸识别可以在很多方面提高监控能力。
然而,这项技术也带来了一些风险。各种面部欺诈方法可以用来欺诈这些系统。因此,防止面部欺诈对于防止安全漏洞至关重要。
为了支持人脸反欺诈的研究,本文作者引入了一个多模式人脸反欺诈数据集CASIASURF。截至本文撰写之日,它是最大的反欺诈开放数据集。
具体来说,该数据集包括从1000个主题中以RGB、深度和红外拍摄的21000个视频。除了数据集之外,作者还提出了一种新的多模式融合模型作为人脸反欺诈的基准。
已发表/最近更新-2019年4月1日
作者和投稿人-张世锋(NLPR、中亚、高加索山脉、中国)、王小波(JDAI研究)、刘阿健(中国澳门)、陈旭·赵(中亚、高加索山脉、中国高加索山脉)、万军(NLPR、中亚、高加索山脉、中国)、塞尔吉奥·埃斯卡雷拉(巴塞罗那大学)、石海林(中亚、高加索山脉研究)、王泽正(约旦金融)、斯坦·李(北草坪会议大楼、中亚、中亚、中国高加索山脉)。
2. FaceNet:人脸识别和聚类的统一嵌入
3. 概率脸部嵌入
本文中,作者提出了一个名为FaceNet的人脸识别系统。
系统使用深度卷积神经网络来优化嵌入,而不是使用中间瓶颈层。作者指出,这种方法最重要的方面是系统的端到端学习。
该团队在中央处理器集群上训练卷积神经网络1000到2000小时。然后,他们在四个数据集上评估了他们的方法。
值得注意的是,FaceNet在著名的LFW数据集上的准确率达到99.63%,在Youtube Faces数据库上的准确率达到95.12%。
发布/最新更新-2015年6月17日
作者兼作家——弗洛里安·施罗夫、德米特里·卡莱尼琴科和詹姆斯·菲尔宾,来自谷歌公司
4. 人脸识别的魔鬼在噪音中
5. VGGFace2:用于识别跨姿势和年龄的人脸的数据集
当前人脸识别嵌入方法,能够在受控设置下实现高性能。这些方法通过拍摄人脸图像并将人脸数据存储在潜在的语义空间中来工作。
但是,当在完全不受控制的设置下进行测试时,当前方法无法正常执行。这是由于缺乏面部特征或图像模糊。这方面的一个例子是监控视频中的人脸识别,其中视频质量可能非常低。
为了帮助解决这个问题,本文作者提出了概率人脸嵌入(PFE)。作者提出了一种将现有的确定性嵌入转换成PFE的方法。最重要的是,作者指出该方法有效地提高了人脸识别模型的性能。
发布/最新更新-2019年8月7日
作者和投稿人-来自密歇根州立大学的研究人员伊春·施和阿尼尔·贾恩。
汤研究所、加州大学圣地亚哥分校和南洋理工大学研究了噪声在大规模面部图像数据集中的影响。
由于其大小和成本效益,许多大型数据集容易产生标签噪声。本文旨在提供关于标签噪声源及其在人脸识别模型中的后果的知识。此外,他们的目标是建立和发布一个干净的人脸识别数据集,称为IMDb人脸。
本研究的两个主要目标是发现噪声对最终表现的影响,并确定标注面部特征的策略。为此,该团队手动清理了两个流行的开放人脸图像数据集MegaFace和ms-celleb-1m。他们的实验表明,仅在32%的兆面数据集和20%的质谱-Celle B-1M清洁数据集上训练的模型与在整个原始未清洁数据集上训练的模型具有相似的性能。
作者和撰稿人——王菲(感知时间)、李仁臣(加州大学圣地亚哥分校)、李成(感知时间)、石爻黄(感知时间)、陈彦杰(感知时间)、陈谦(感知时间)和陈昌乐(南洋理工大学)。
许多关于深回旋神经网络人脸识别的研究已经展开。反过来,已经创建了许多大规模的面部图像数据集来训练这些模型。然而,这篇文章的作者指出,以前发布的数据集并不包含大量关于面部姿势和年龄变化的数据。
在这篇文章中,牛津大学的研究人员介绍了VGGFace2数据集。数据集包含各种年龄、种族、光照和姿势变化的图像。数据集包含331万张图像和9131个对象。
极牛网精选文章《5篇论文了解如何实现人脸反欺诈、跨姿势识别等》文中所述为作者独立观点,不代表极牛网立场。如若转载请注明出处:https://geeknb.com/3060.html