人脸识别最全知识图谱—清华大学出品【附下载】| 智东西内参

日期:2023-02-28 17:49:57 / 人气:218

在 LFW 上取得了 95.17%的精度。这一后果标明:大训练数据集关于无效提升非受限环境下的人脸辨认很重要。但是,以上一切这些经典办法,都难以处置大规模数据集的训练场景。2014年:2014 年前后,随着大数据和深度学习的开展,神经网络重受注目,并在图像分类、手写体辨认、语音辨认等使用中取得了远超经典办法的后果。香港中文大学的 Sun Yi 等人提出将卷积神经网络使用到人脸辨认上,采用 20 万训练数据,在 LFW 上第一次失掉超越人类程度的辨认精度,这是人脸辨认开展历史上的一座里程碑。自此之后,研讨者们不时改良网络构造,同时扩展训练样本规模,将 LFW 上的辨认精度推到 99.5%以上。人脸辨认开展进程中一些经典的办法及其在 LFW 上的精度,都有一个根本的趋向:训练数据规模越来越大,辨认精度越来越高。▲人脸辨认技术开展历程3、中国政策支持2015 年以来,国度密集出台了《关于银行业金融机构近程开立人民币账户的指点意见(征求意见稿)》,给人脸辨认普及翻开了门缝;其后,《平安防备视频监控人脸辨认零碎技术要求》、《信息平安技术网络人脸辨认认证零碎平安技术要求》等法律法规,爲人脸辨认在金融、安防、医疗等范畴的普及打下了坚实的根底,扫清了政策妨碍。同时,2017 年人工智能初次写入国度政府报告,作爲人工智能的重要细分范畴,国度对人脸辨认相关的政策支持力度在不时的加大。2017 年 12 月发布的《促进新一代人工智能产业开展三年举动方案(2018-2020 年)》规划“到 2020 年,复杂静态场景下人脸辨认无效检出率超越 97%,正确辨认率超越 90%”。▲人脸辨认相关政策4、开展热点研讨经过对以往人脸辨认范畴论文的发掘,总结出人脸辨认范畴的研讨关键词次要集中在人脸辨认、特征提取、稀疏表示、图像分类、神经网络、目的检测、人脸图像、人脸检测、图像表示、计算机视觉、姿势估量、人脸确认等范畴。下图是对人脸辨认研讨趋向的剖析,旨在基于历史的科研效果数据的根底上,对技术来源、热度甚至开展趋向停止研讨。图 2 中,每个黑色分支代表一个关键词范畴,其宽度表示该关键词的研讨热度,各关键词在每一年份的地位是依照这一工夫上一切关键词的热度高度停止排序。后来,Computer Vision(计算机视觉)是研讨的热点,在 20 世纪末期,Feature Extraction(特征提取)逾越 CV,成爲研讨的新热点,其后在 21 世纪初期被 Face Recognition 超越,至今不断处在第二的地位上。▲人脸辨认相关热点此外,研讨依据最近两年宣布于 FG(International Conference on Automatic Face and Gesture Recognition)的论文中提取出来的关键词发现,Face Recognition 呈现频率最高,爲118 次,Object Detection 排在第二位,爲 41 次,Image Classification 和 Object Recognition 以36 次并列第三,呈现次数超越十次的词汇还有 Image Segmentation(32)、Action Recognition(32)、Sparse Representation(28)、Image Retrieval(27)、Visual Tracking(24)、SingleImage(23)。词云图如下所示:▲人脸辨认词云剖析5、人脸辨认相关会议计算机视觉(CV)界三大顶级国际会议:ICCV: IEEE International Conference on Computer Vision该会议由美国电气和电子工程师学会(IEEE, Institute of Electrical & Electronic Engineers)主办,次要在欧洲、亚洲、美洲的一些科研实力较强的国度举行。作爲世界顶级的学术会议,首届国际计算机视觉大会于 1987 年在伦敦开幕,其后两年举行一届。 ICCV 是计算机视觉范畴最初级别的会议,会议的论文集代表了计算机视觉范畴最新的开展方向和程度。 论文承受率在 20%左右。方向爲计算机视觉、形式辨认、多媒体计算等。近年来,全球学界愈来愈关注中国人在计算机视觉范畴所获得的科研成就,这是由于由中国人主导的相关研讨已获得了长足的提高——2007 年大会共收到论文 1200 余篇,而获选论文仅爲 244 篇,其中来自中国大陆,香港及台湾的论文有超越 30 篇,超越大会获选论文总数的 12%。作爲最早投入深度学习技术研发的华人团队,在多年布局的关键技术根底之上,香港中文大学教授汤晓鸥带领的团队迅速获得技术打破。2012 年国际计算视觉与形式辨认会议(CVPR)上仅有的两篇深度学习文章均出自汤晓鸥实验室,而在 2013 年国际计算机视觉大会(ICCV)上全球学者共宣布的 8 篇深度学习范畴的文章中,有 6 篇出自汤晓鸥实验室。CVPR:IEEE Conference on Computer Vision and Pattern Recognition该会议是由 IEEE 举行的计算机视觉和形式辨认范畴的顶级会议。每年召开一次,录取率在 25%左右。方向爲计算机视觉、形式辨认、多媒体计算等。香港中文大学教授汤晓鸥带领的团队在全球范围内做出了少量深度学习原创技术打破:2012 年国际计算视觉与形式辨认会议(CVPR)上仅有的两篇深度学习文章均出自其实验室;2011—2013 年间在计算机视觉范畴两大顶级会议 ICCV 和 CVPR 上宣布了 14 篇深度学习论文,占据全世界在这两个会议上深度学习论文总数(29篇)的近一半。他在 2009 年取得计算机视觉范畴两大最顶尖的国际学术会议之一 CVPR 最佳论文奖,这是 CVPR 历史下去自亚洲的论文初次获奖。ECCV:European Conference on Computer VisionECCV 是一个欧洲的会议,每次会议在全球范围录用论文 300 篇左右,次要的录用论文都来自美国、欧洲等顶尖实验室及研讨所,中国大陆的论文数量普通在 10-20 篇之间。ECCV2010 的论文录取率爲 27%。两年召开一次,论文承受率在 20%左右。方向爲计算机视觉、形式辨认、多媒体计算等。2018 年的 ECCV 于 2018 年 9 月 8 日-14 日在德国慕尼黑举行。亚洲计算机视觉会议:ACCV:Asian Conference on Computer VisionACCV 即亚洲计算机视觉会议,是 AFCV(Asian Federation of Computer Vision,亚洲计算机视觉联盟)自 1993 年以来官方组织的两年一度的会议,旨在爲研讨者、开发者和参与者提供一个良好的平台来展现和讨论计算机视觉范畴和相关范畴的新成绩、新方案和新技术。2018 年第 14 届亚洲计算机视觉会议将于 2018 年 12 月 4 日-6 日在澳大利亚举行。人脸和手势辨认专门的会议:FG:IEEE International Conference on Automatic Face and Gesture Recognition“International Conference on Automatic Face and Gesture Recognition”是全球范围内人脸与手势辨认范畴的威望学术会议。会议方向有人脸检测、人脸辨认、表情辨认、姿态剖析、心思行爲剖析等。人脸辨认技术详解1、人脸辨认流程人脸辨认技术原理复杂来讲次要是三大步骤:一是树立一个包括大批量人脸图像的数据库,二是经过各种方式来获妥当前要停止辨认的目的人脸图像,三是将目的人脸图像与数据库中既有的人脸图像停止比对和挑选。依据人脸辨认技术原理详细施行起来的技术流程则次要包括以下四个局部,即人脸图像的采集与预处置、人脸检测、人脸特征提取、人脸辨认和活体鉴别。▲人脸辨认技术流程人脸图像的采集与预处置人脸图像的采集与检测详细可分爲人脸图像的采集和人脸图像的检测两部分外容。人脸图像的采集:采集人脸图像通常状况下有两种途径,辨别是既有人脸图像的批量导入和人脸图像的实时采集。一些比拟先进的人脸辨认零碎甚至可以支持有条件的过滤掉不契合人脸辨认质量要求或许是明晰度质量较低的人脸图像,尽能够的做到明晰精准的采集。既有人脸图像的批量导入:行将经过各种方式采集好的人脸图像批量导入至人脸辨认零碎,零碎会自动完成逐一人脸图像的采集打工。人脸图像的实时采集:即调用摄像机或摄像头在设备的可拍摄范围内自动实时抓取人脸图像并完成采集打工。人脸图像的预处置:人脸图像的预处置的目的是在零碎对人脸图像的检测根底之上,对人脸图像做出进一步的处置以利于人脸图像的特征提取。人脸图像的预处置详细而言是指对零碎采集到的人脸图像停止光线、旋转、切割、过滤、降噪、缩小减少等一系列的复杂处置进程来使得该人脸图像无论是从光线、角度、间隔、大小等任何方面来看均可以契合人脸图像的特征提取的规范要求。在理想环境下采集图像,由于图像遭到光线明暗不同、脸部表情变化、暗影遮挡等众多内在要素的搅扰,招致采集图像质量不理想,那就需求先对采集到的图像预处置,假如图像预处置不好,将会严重影响后续的人脸检测与辨认。研讨引见三种图像预处置手腕,即灰度调整、图像滤波、图像尺寸归一化等。灰度调整:由于人脸图像处置的最终图像普通都是二值化图像,并且由于地点、设备、光照等方面的差别,形成采集到黑色图像质量不同,因而需求对图像停止一致的灰度处置,来平滑处置这些差别。灰度调整的常用办法有均匀值法、直方图变换法、幂次变换法、对数变换法等。图像滤波:在实践的人脸图像采集进程中,人脸图像的质量会遭到各种噪声的影响,这些噪声来源于多个方面,比方四周环境中充满少量的电磁信号、数字图像传输遭到电磁信号的搅扰等影响信道,进而影响人脸图像的质量。爲保证图像的质量,减小噪声对后续处置进程的影响, 必需对图像停止降噪处置。去除噪声处置的原理和办法很多,罕见的有均值滤波,中值滤波等。目前常用中值滤波算法对人脸图像停止预处置。图像尺寸归一化:在停止复杂的人脸训练时分,遇到人脸库的图像像素大小不一样时,我们需求在上位机人脸比对辨认之前对图像做尺寸归一化处置。需求比拟罕见的尺寸归一化算法有双线性插值算法、最近邻插值算法和立方卷积算法等。人脸检测一张包括人脸图像的图片通常状况下能够还会包括其他内容,这时分就需求停止必要的人脸检测。也就是在一张人脸图像之中,零碎会精准的定位出人脸的地位和大小,在挑选出有用的图像信息的同时自动剔除掉其他多余的图像信息来进一步的保证人脸图像的精准采集。人脸检测是人脸辨认中的重要组成局部。人脸检测是指使用一定的战略对给出的图片或许视频来停止检索,判别能否存在着人脸,假如存在则定位出每张人脸的地位、大小与姿势的进程。人脸检测是一个具有应战性的目的检测成绩,次要表现在两方面:人脸目的内在的变化惹起:1、人脸具有相当复杂的细节变化和不同的表情(眼、嘴的开与闭等),不同的人脸具有不同的外貌,如脸形、肤色等;2、人脸的遮挡,如眼镜、头发和头部饰物等。内在条件变化惹起:1、由于成像角度的不同形成人脸的多姿势,如立体内旋转、深度旋转以及上下旋转等,其中深度旋转影响较大;2、光照的影响,如图像中的亮度、比照度的变化和暗影等;3、图像的成像条件,如摄像设备的焦距、成像间隔等。人脸检测的作用,便是在一张人脸图像之中,零碎会精准的定位出人脸的地位和大小, 在挑选出有用的图像信息的同时自动剔除掉其他多余的图像信息来进一步的保证人脸图像 的精准采集。人脸检测重点关注以下目标:检测率:辨认正确的人脸/图中一切的人脸。检测率越高,检测模型效果越好; 误检率:辨认错误的人脸/辨认出来的人脸。误检率越低,检测模型效果越好; 漏检率:未辨认出来的人脸/图中一切的人脸。漏检率越低,检测模型效果越好; 速度:从采集图像完成到人脸检测完成的工夫。工夫越短,检测模型效果越好。目前的人脸检测办法可分爲三类,辨别是基于肤色模型的检测、基于边缘特征的检测、基于统计实际办法,上面将对其停止复杂的引见:1、基于肤色模型的检测:肤色用于人脸检测时,可采用不同的建模办法,次要有高斯模型、高斯混合模型,以及非参数估量等。应用高斯模型和高斯混合模型可以在不同颜色空间中树立肤色模型来停止人脸检测。经过提取黑色图像中的面部区域以完成人脸检测的办法可以处置多种光照的状况, 但该算法需求在固定摄像机参数的前提下才无效。Comaniciu 等学者应用非参数的核函数概率密度估量法来树立肤色模型,并运用 mean-shift 办法停止部分搜索完成了人脸的检测和跟踪。这一办法进步了人脸的检测速度,关于遮挡和光照也有一定的鲁棒性。该办法的缺乏是和其他办法的可结合性不是很高,同时,用于人脸检测时,处置复杂背景和多团体脸时存在困难。爲了处理人脸检测中的光照成绩,可以针对不同光照停止补偿,然后再检测图像中的肤色区域。这样可以处理黑色图像中偏光、背景复杂和多团体脸的检测成绩,但对人脸颜色、地位、尺度、旋转、姿势和表情等具有不敏理性。2、基于边缘特征的检测:应用图像的边缘特征检测人脸时,计算量绝对较小,可以完成实时检测。大少数运用边缘特征的算法都是基于人脸的边缘轮廓特性,应用树立的模板(如椭圆模版)停止婚配。也有研讨者采用椭圆环模型与边缘方向特征,完成复杂背景的人脸检测。Fröba 等采用基于边缘方向婚配(Edge-Orientation Matching,EOM)的办法,在边缘方向图中停止人脸检测。该算法在复杂背景下误检率比拟高,但是与其他的特征相交融后可以取得很棒的效果。3、 基于统计实际办法:本文重点引见基于统计实际办法中的Adaboost人脸检测算法。Adaboost算法是经过有数次循环迭代来寻求最优分类器的进程。用弱分类器Haar特征中任一特征放在人脸样本上,求出人脸特征值,经过更多分类器的级联便失掉人脸的量化特征,以此来区分人脸和非人脸。Haar功用由一些复杂黑色白色程度垂直或旋转45°的矩形组成。目前的Haar特征总的来说狭义地分爲三类:边缘特征、线特征以及中心特征。这一算法是由剑桥大学的 Paul Viola 和 Michael Jones 两位学者提出,该算法优点在于不只计算速度快,还可以到达和其他算法相当的功能,所以在人脸检测中使用比拟普遍,但也存在着较高的误检率。由于在采用 Adaboost 算法学习的进程中,最初总有一些人脸和非人脸形式难以区分,而且其检测的后果中存在一些与人脸形式并不相像的窗口。人脸特征提取目前主流的人脸辨认零碎可支持运用的特征通常可分爲人脸视觉特征、人脸图像像素统计特征等,而人脸图像的特征提取就是针对人脸上的一些详细特征来提取的。特征复杂,婚配算规律复杂,适用于大规模的建库;反之,则适用于小规模库。特征提取的办法普通包括基于知识的提取办法或许基于代数特征的提取办法。以基于知识的人脸辨认提取办法中的一种爲例,由于人脸次要是由眼睛、额头、鼻子、耳朵、下巴、嘴巴等部位组成,对这些部位以及它们之间的构造关系都是可以用几何外形特征来停止描绘的,也就是说每一团体的人脸图像都可以有一个对应的几何外形特征,它可以协助我们作爲辨认人脸的重要差别特征,这也是基于知识的提取办法中的一种。人脸辨认我们可以在人脸辨认零碎中设定一团体脸类似水平的数值,再将对应的人脸图像与零碎数据库中的一切人脸图像停止比对,若超越了预设的类似数值,那麼零碎将会把超越的人脸图像逐一输入,此时我们就需求依据人脸图像的类似水平上下和人脸自身的身份信息来停止准确挑选,这一准确挑选的进程又可以分爲两类:其一是一对一的挑选,即对人脸身份停止确认进程;其二是一对多的挑选,即依据人脸类似水平停止婚配比对的进程。活体鉴别生物特征辨认的共同成绩之一就是要区别该信号能否来自于真正的生物体,比方,指纹辨认零碎需求区别带辨认的指纹是来自于人的手指还是指纹手套,人脸辨认零碎所采集到的人脸图像,是来自于真实的人脸还是含有人脸的照片。因而,实践的人脸辨认系一致般需求添加活体鉴别环节,例如,要求人左右转头,眨眼睛,开启齿说句话等。2、 人脸辨认次要办法人脸辨认技术的研讨是一个跨越多个学科范畴知识的高端技术研讨打工,其包括多个学科的专业知识,如图像处置、生理学、心思学、形式辨认等知识。在人脸辨认技术研讨的范畴中,目前次要有几种研讨的方向,如:一种是依据人脸特征统计学的辨认办法,其次要有特征脸的办法以及隐马尔科夫模型(HMM,Hidden Markov Model)办法等;另一种人脸辨认办法是关于衔接机制的,次要有人工神经网络(ANN,Artificial Neural Network)办法和支持向量机(SVM,Support Vector Machine)办法等;还有一个就是综合多种辨认方式的办法。基于特征脸的办法特征脸的办法是一种比拟经典而又使用比拟广的人脸辨认办法,其次要原理是把图像做降维算法,使得数据的处置更容易,同时,速度又比拟快。特征脸的人脸辨认办法,实践上是将图像做 Karhunen-Loeve 变换,把一个高维的向量转化爲低维的向量,从而消弭每个重量存在的关联性,使得变换失掉的图像与之对应特征值递加。在图像经过 K-L 变换后,其具有很棒的位移不变性和波动性。所以,特征脸的人脸辨认办法具无方便完成,并且可以做到速度更快,以及对正面人脸图像的辨认率相当初等优点。但是,该办法也具有缺乏的中央, 就是比拟容易受人脸表情、姿势和光照改动等要素的影响,从而招致辨认率低的状况。 基于几何特征的办法基于几何特征的辨认办法是依据人脸面部器官的特征及其几何外形停止的一种人脸辨认办法,是人们最早研讨及运用的辨认办法,它次要是采用不同人脸的不同特征等信息停止婚配辨认,这种算法具有较快的辨认速度,同时,其占用的内存也比拟小,但是,其辨认率也并不算高。该办法次要做法是首先对人脸的嘴巴、鼻子、眼睛等人脸次要特征器官的地位和大小停止检测,然后应用这些器官的几何散布关系和比例来婚配,从而到达人脸辨认。基于几何特征辨认的流程大体如下:首先对人脸面部的各个特征点及其地位停止检测, 如鼻子、嘴巴和眼睛等地位,然后计算这些特征之间的间隔,失掉可以表达每个特征脸的矢量特征信息,例如眼睛的地位,眉毛的长度等,其次还计算每个特征与之绝对应关系,与人脸数据库中已知人脸对应特征信息来做比拟,最初得出最佳的婚配人脸。基于几何特征的办法契合人们对人脸特征的看法,另外,每幅人脸只存储一个特征,所以占用的空间比拟小; 同时,这种办法对光照惹起的变化并不会降低其辨认率,而且特征模板的婚配和辨认率比拟高。但是,基于几何特征的办法也存在着鲁棒性不好,一旦表情和姿势略微变化,辨认效果将大打折扣。基于深度学习的办法深度学习的呈现使人脸辨认技术获得了打破性停顿。人脸辨认的最新研讨效果标明,深度学习失掉的人脸特征表达具有手工特征表达所不具有的重要特性,例如它是中度稀疏的、对人脸身份和人脸属性有很强的选择性、对部分遮挡具有良好的鲁棒性。这些特性是经过大数据训练自然失掉的,并未对模型参加显式约束或前期处置,这也是深度学习能成功使用在人脸辨认中的次要缘由。深度学习在人脸辨认上有 7 个方面的典型使用:基于卷积神经网络(CNN)的人脸辨认办法,深度非线性人脸外形提取办法,基于深度学习的人脸姿势鲁棒性建模,有约束环境中的全自动人脸辨认,基于深度学习的视频监控下的人脸辨认,基于深度学习的低分辨率人脸辨认及其他基于深度学习的人脸相关信息的辨认。其中,卷积神经网络(Convolutional Neural Networks,CNN)是第一个真正成功训练多层网络构造的学习算法,基于卷积神经网络的人脸辨认办法是一种深度的监视学习下的机器学习模型,能发掘数据部分特征,提取全局训练特征和分类,其权值共享构造网络使之更相似于生物神经网络,在形式辨认各个范畴都失掉成功使用。CNN 经过结合人脸图像空间的部分感知区域、共享权重、在空间或工夫上的降采样来充沛应用数据自身包括的部分性等特征,优化模型构造,保证一定的位移不变性。应用 CNN 模型,香港中文大学的 Deep ID 项目以及 Facebook 的 Deep Face 项目在 LFW 数据库上的人脸辨认正确率辨别达 97.45%和 97.35%只比人类视觉辨认 97.5%的正确率略低。在获得打破性效果之后,香港中文大学的 DeepID2 项目将辨认率进步到了 99.15%。Deep ID2 经过学习非线性特征变换使类内变化到达最小,而同时使不同

作者:盛煌娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 盛煌娱乐 版权所有