摘要
生物特征识别技术使用了人体本身所固有的生物特征,与传统的身份识别方法完全不同,具有更高的安全性、可靠性、和有效性,越来越受到人们的重视。人脸识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别在公共安全、证件验证、门禁系统、视频监视等领域中都有着广泛的应用前景。
本文是在人脸数据库的基础上做人脸特征提取和识别研究,主要内容如下:
(1)对人脸识别研究的内容、相关技术、主要实现方法及发展历程作了详细介绍。
(2)介绍主成分分析法(PCA)、K-L变换,并利用特征脸方法实现了人脸识别。
关键词: 人脸识别,特征脸,主成分分析
作者:张帆
指导老师:王震宇
Abstract
Biometics,because of using the proper living creature characteristic of human body,is the totally brand new technique different from traditional personal ideniification method and it has the better safety,dependable with the usefulness,and it was payed great attention.Face recongnition is an important component of biometrics and in all kinds of methods,it is also one of the most active and challenging tasks for computer vision and pattern recognition in recent 30 years.Face recognition has a wide range of potential app1ications in the areas of public security,identification of certificate,entrance control and video surveillanee.
This paper mainly studies the approaches to the features extraction and recognition in the face database.The main contents are as follows:
(1)Give a full introduce to the contents of face recongnition,related techonology,the main implement methods and its development history.
(2)Give a introduce to the Princeple Components Analysis(PCA),K-L translation,and realized it via eigenface method.
Key Words: Face Recongnition,Eigenface, Principle Component Analysis
目录
摘要 (Ⅰ)
ABSTRACT (Ⅱ)
前言 (1)
第1章人脸识别技术概述 (3)
1.1生物特征识别技术和人脸识别技术 (3)
1.2人脸识别技术股国内外发展概况 (4)
1.3现阶段人脸识别应用举例 (5)
1.4人脸识别的难点 (7)
第2章人脸识别的常用算法与分类绍 (8)
2.1人脸识别常用算法 (8)
2.2 分类器介绍 (10)
第3章基于pca的人脸识别系统的设计和实现 (12)
3.1人脸识别流程 (12)
3.2 kl变换和pca分析 (14)
3.2.1简介 (14)
3.2.2 K-L变换 (15)
3.2.3 pca分析 (16)
3.3 人脸识别pca方法的步骤和流程 (19)
3.3.1 pca方法人脸识别步骤 (19)
3.3.2 计算特征脸 (19)
3.3.3 使用特征连脸进行人脸识别 (21)
3.4 pca人脸识别系统的优缺点 (21)
第4章影响人脸识别的几个因素及常用人脸数据库介绍 (22)
4.1影响人脸识别的因素 (22)
4.2 常用人脸数据库介绍 (23)
第5章总结与展望 (25)
5.1总结 (25)
5.2展望 (25)
参考文献 (26)
附录 (27)
致谢 (30)
前言
在人类社会的发展进入到21世纪的今天,安全问题已经成为困扰人们日常生活的重要问题之一。社会的发展促进了人的流动性,进而也增加了社会的不稳定性,使得安全方面的需求成为21世纪引起广泛关注的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高,因为通常由于记忆的原因,人们经常会选用自己或亲人的生日、家庭地址、电话号码等作为密码并长期使用,这些很容易被一些不法分子获取。可见在现代社会中,身份识别已经成为人们日常生活中经常遇到的一个基本问题。人们乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。人们需要携带的身份标识物品越来越多,身份标识知识也变得越来越复杂和冗长在这种情况下,传统身份识别方式的弊端日益彰显。身份标识物品容易被丢失和伪造,份标识知识容易被遗忘、窃取和破解,而身份标识的重要性又使得一旦失去了身份标识会给标识的所有者甚至整个社会带来重大的甚至难以弥补的损失。在美国,每年约有上百万的福利款被人以假冒的身份领取;每年发生的信用卡、ATM、移动电话和冒领支票等成的损失达数百亿美元[2]。面临着这样的状况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。
于是,近年来人类生物特征越来越广泛地用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。与原有的人类身分识别技术(如:个人密码、磁卡、智能卡等)相比,基于人类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。人类本身具有很多相对独特的特征,如DNA、指纹、虹膜、语音、人脸等。基于这些相对独特的人类特征,结合计算机技术,发展起众多的基于人类生物特征的人类身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术。
人脸识别和其他的生物识别比起来有以下几个优点:1、其他的生物特征识别方法都需要一些人为的行为配合,而人脸识别不需要。2、人脸识别可应用在远距离监控中。3、针一对现在的第一、二代身份证,每个身份证都有人脸的正面照片,也就是人脸库将是最完善的,包括人最多的,我们可以利用这个库来更直观、更方便的核查该人的身份。
4、相对于其他基于生物特征识别技术,人脸识别技术具有特征录入方一便,信息丰富,使用面广等优点,同时人脸识别系统更加直接友好。人脸识别技术作为生物识别技术的
一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。
人脸识别技术可应用于以下方面:
1.在安全防范领域中的应用
社会上有许多重要的部门,如军事、金融、保密等部门都需要对出入人员进行身份识别,以防止信息泄漏和不法现象的发生。使用该技术可以方便地进行身份识别,而不使被识别者感到不舒服。
2.在犯罪刑侦领域中的应用
在刑侦工作中,对罪犯的抓捕是至关重要的一环。应用人脸识别技术可以依据犯罪嫌疑人的人脸图像对机场、车站、港口等重要交通场所进行监控,从而大大促进了罪犯抓捕工作的开展。
3.在公共事业领域中的应用
在现代社会,许多领域都需要对人进行身份验证。如银行、保险、交通等公共事业部门。采用传统的密码、IC卡等手段和技术对人进行身份验证具有安全性差、易遗失、易伪造等缺点。而采用人脸识别技术进行身份验证则能够很好地克服传统身份验证手段和技术的缺点。
第一章人脸识别概述
1.1生物特征识别技术和人脸识别技术
生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与生俱来多为先天性的;行为特征则是习惯使然,多是后天性的。我们将生理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、视网膜、脸像、声音、笔迹等。
那么,生物特征识别技术是如何进行个人特征识别的呢?
生物鉴别的过程分成三个步骤:生物特征数据采样,生物特征提取和特征匹配。数据采样过程是通过各种传感器对生物特征进行原始数据采集的过程,生物特征提取过程则从传感器采集的数据中抽取出反映个体特性的信息(通常是某种数学上的编码过程),匹配阶段则是计算生物特征之间的相似性并进行排序和一致性判断的过程。
生物特征识别技术主要有人脸识别、指纹识别、语音识别、虹膜识别等。生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。
所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:
(1)人脸检测从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。
(2)人脸表征确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。
(3)人脸鉴别即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的
已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的表征方式密切相关。
(4)表情/姿态分析即对待识别人脸的表情或姿态进行分析,并对其加以归类。
(5)生理分类对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。
本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。
人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向。
1.2人脸识别国内外发展概况
见诸文献的机器自动人脸识别研究开始于1966年PRI的Bledsoe的工作,1990年日本研制的人像识别机,可在1秒钟内中从3500人中识别到你要找的人。1993年,美国国防部高级研究项目署 (Advanced Research Projects Agency)和美国陆军研究实验室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 项目组,建立了feret人脸数据库,用于评价人脸识别算法的性能。
美国陆军实验室也是利用vc++开发,通过软件实现的,并且FAR为49%。在美国的进行的公开测试中,FAR,为53%。美国国防部高级研究项目署,利用半自动和全自动算法。这种算法需要人工或自动指出图像中人的两眼的中心坐标,然后进行识别。在机场开展的测试中,系统发出的错误警报太多,国外的一些高校(卡内基梅隆大学(Carnegie Mellon University)为首,麻省理工大学(Massachusetts Institute of Technology )等,英国的雷丁大学(University of Reading))和公司(Visionics公司Facelt人脸识别系统、Viiage的FaceFINDER身份验证系统、Lau Tech公司Hunter系统、德国的BioID系统等)的工程研究工作也主要放在公安、刑事方面,在考试验证系统的实现方面深入研究并不多。
人脸识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能门禁、司机驾照验证、计算机登录系统。我国在这方面也取得了较好的成就,国家863项目“面像检测与识别核心技术”通过成果鉴定并初步应用,就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术。北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,消除了照相机的影响,再对图像进行特征
提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一张照片,使用相距1--7年、差别比较大的照片去查询,首选率可以达到50%,前20张输出照片中包含有与输入照片为同一人的照片的概率可达70% 。2005年1月18日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家”十五”攻关项目《人脸识别系统》通过了由公安部主持的专家鉴定。鉴定委员会认为,该项技术处于国内领先水平和国际先进水平。
1.3现阶段人脸识别应用举例
数码相机人脸自动对焦和笑脸快门技术
首先是面部捕捉。它根据人的头部的部位进行判定,首先确定头部,然后判断眼睛和嘴巴等头部特征,通过特征库的比对,确认是人面部,完成面部捕捉。然后以人脸为焦点进行自动对焦,可以大大的提升拍出照片的清晰度。笑脸快门技术就是在人脸识别的基础上,完成了面部捕捉,然后开始判断嘴的上弯程度和眼的下弯程度,来判断是不是笑了。以上所有的捕捉和比较都是在对比特征库的情况下完成的,所以特征库是基础,里面有各种典型的面部和笑脸特征数据。
公安刑侦破案
通过查询目标人像数据寻找数据库中是否存在重点人口基本信息。例如在机场或车站安装系统以抓捕在逃案犯。
门禁系统
受安全保护的地区可以通过人脸识别辨识试图进入者的身份。人脸识别系统可用于企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等
门禁系统
摄像防盗系统
可在机场、体育场、超级市场等公共场所对人群进行监视,例如在机场安装监视系统以防止恐怖分子登机。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。
信用卡网络支付
信用卡网络支付
利用人脸识别辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡等。
身份辨识
如电子护照及身份证。这或许是未来规模最大的应用。在国际民航组织已确定,从2010年4月1日起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。美国已经要求和它有出入免签证协议的国家在2006年10月26日之前必须使用结合了人脸指纹等生物特征的电子护照系统,到2006年底已经有50多个国家实现了这样的系统。今年年初,美国运输安全署( Transportation Security Administration)计划在全美推广一项基于生物特征的国内通用旅行证件。欧洲很多国家也在计划或者正在实施类似的计划,用包含生物特征的证件对旅客进行识别和管理。中国的电子护照计划公安部一所正在加紧规划和实施。
信息安全
如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现。如果密码被盗,就无法保证安全。如果使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一。从而大大增加电子商务和电子政务系统的可靠性。
1.4人脸识别的难点
人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。人脸识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是FRT在实用应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题。
目前人脸识别的难点主要存在于以下几个方面:
(1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。
(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。
(3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。
(4)采集图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。
(5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64*64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运动等有用信息的。如果使用全部的有用信息,计算量就更大了。
第二章人脸识别的常用算法介绍
2.1人脸识别常用方法
人脸识别的方法主要有:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法、基于小波特征的人脸识别方法和基于模型的人脸识别方法。其中基于模型的人脸识别方法包括特征脸法(Eigneafec)、神经网络法(NN)、隐马尔可夫模型方法(HMM)等方法。
●基于面部几何特征的方法
这个方法在时间上来说是最早提出的人脸识别方法之一,其特征提取以人脸面部特征点的形状和几何关系为基础的。对于不同的人来说有着不同的人脸轮廓、大小、相对位置的分布也是不相同的,所以说用这种方法来进行人脸识别还是有一定依据的。这种方法的做法是,提取眉毛、眼睛、鼻子和嘴巴这几个特征点,计算出这几个特征点的大小,以及他们之间的几何距离,来进行人脸识别,几何距离一般包括特征点之间的距离、他们之间的夹角等。特征提取后选取最近邻分类器,相异度测试选用欧式距离。基于几何特征的人脸识别算法的优点是方法简单,计算速度快。但它识别人脸就靠几个特征点的大小和距离,以及特征点之间的夹角,这样的信息是远远不够的,对于一个稍微大一点的人脸库识别率不高,还有这种方法对于人脸表情变化时没有很好的鲁棒性。但是这种方法还是有一定潜力的,好比一个大型的人脸库,进行人脸比对前可以使用基于面部几何特征的方法对训练样本进行粗分类,这样可以大大降低人脸识别时间。
●基于模板匹配的方法
模板匹配方法也是模式识别中的一个比较传统的方法。把模板匹配方法用到人脸识别中要以Poggio和Bruneili所提出的基于局部特征的模板匹配算法为代表。他们首先利用积分投影的方法确定面部特征点,提取局部特征的模板,然后进行局部模板匹配,计算相关系数进行分类,Poggio和Brulleili比较了基于几何特征和基于模板匹配的人脸识别方法。他们的实验结果表明,在人脸尺度、光照、姿态稳定的情况下,基于模板匹配的人脸识别方法要优于基于几何特征的人脸识别方法。通过大量的实验表明,基于模板匹配的人脸识别方法对光照、旋转、人脸表情比较敏感,仅当这些因素比较稳定时,才能获得比较好的效果。这种方法的计算量要比基于面部几何特征的方法要大。
●基于小波特征的方法
小波变换是国际上公认的最新频率分析工具,由于其“自适应性‘,和“数学显微镜性质”而成为许多学科共同关注的焦点,在信号处理中起着至关重要的作用。目前小
波技术在验证的特征撮上用得较多。小波变换采用以高斯函数的二阶导数作为小波基的小波变换技术来进行拐点提取,然后以该方法为基础,进行不同图像之间拐点序列的匹配;最后再利用提敢的拐点来对图像进行分段和段一段对应处理。由于使用离散小波变换来分解图像的参数特征,特征提取用到自适应算法,匹配则选择动态规划方法,初步试验取得较好的效果。
●基于特征脸的方法
特征脸方法是从主成成分分析(PCA)导出的一种人脸识别和描述技术。它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因此又被称为特征脸。利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。
●神经网络法
基于神经网络的人脸识别方法就是利用神经网络的学习能力和分类能力对人脸进行特征提取与识别。目前常用的人工神经网络方法是BP(Back-Propagation)神经网络、自组织神经网络、径向基函数神经网络。径向基函数神经网络与BP网络一样都是多层前向网络,它以径向基函数作为基准,以高斯函数作为隐含层的激励函数。这种网络的学习速率快、函数逼近、模式识别等能力均优于BP神经网络,并广泛应用于模式识别、图像处理等方面。但是这种网络比BP网络所用的神经元数目要多得多,使它的应用受到了一定的限制。
●隐马尔可夫模型方法(HMM)
HMM作为信号的一种统计模型,目前广泛应用于模式识别、图像处理的各个领域。HMM是一个由两种机理构成的随机过程:一个机理是内在的有限状态Markov链,体现为用具有限状态数的Markov链来模拟签名信号统计特征变化的隐含的随机过程,另一个是一系列随机函数所组成的集合,体现为与Markov链的每一个状态相关联的观测序列的随机过程。设有观察序列Q=Q1Q2…Qn和状态集=S{s1,s2,…sn},一个有n个状态的隐马尔可夫模型λ可以表示(π,A,B),其中π为初始状态概率矢量;A={aij}为状态转移概率矩阵,其中aij=P{qt+1=Sj|qt=St},1<=i,j<=N;B={bj}Qt)}为观察符号概率分布,若B有M个观察值{v1,v2…mv},则bj(Qt)=P{qt=vk|qt=sj,1<=j<=N,l<=k<=M}。
HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个HMM的隐藏状态数,并且优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像相匹配。匹配阶段涉及到一个特定的HMM可能产生相应于所观察图像特征的测试符号序列的概率计算。利用H顾进行验证同样由两个阶段组成,即利用训练样
本估计MHM模型参数和利用HMM评价测试。这两个过程目前都有成熟的算法,HMM参数的估计可用Baum-welch参数估计算法或Segmental K-means算法;对测试样本的评价,可以用Forward-Backward迭代算法估计签名满足模型的概率,或用viterbi最优状态搜索算法计算过程经过的最优状态。因此,利用HMM模型的关键在于HMM类型的选择和一些参数的选择以及阀值的估计[4]。
2.2分类器
在人脸识别过程中,通过提取特征模块,得到表示人脸图像的特征向量,此时需要利用分类器根据提取的特征向量进行分类处理,以确定当前人脸的身份。在这个过程中,分类器起着决策机制的作用,对最终的判别非常关键,分类器性能的优劣也将直接关系到人脸识别结果的好坏。常用的分类器有以下几种:
●最小距离分类器(NC)
最小距离分类器相似度量是以检测样本到类中心的距离大小为判据。
●最近邻分类器(NN)
最近邻法是将所有训练样本都作为代表点,因此在分类时需要计算待识别样本x到所有训练样本的距离,与x最近的训练样本所属于的类别即为待识别样本x所属类别。假定有C个类别ω1、ω、ωn的模式识别问题,每类有标明类别的样本Ni个,i=1,2,…,C,我们可以规定以类的判别函数为:
,k=1,2,…,N
i
.
●三阶近邻法
三阶近邻法是计算像素的差值的绝对值。距离公式可表示为:
L(x,y)=lx
i -y
i
l (2.2.3)
由式(2.2.3)计算所得出的具有最小值的图像并不一定属于同—类别。三阶近邻法计算出与测试图像距离最小的三幅图像,计算这三幅图像所属的类分别计为classl,class2,class3,若classl和class2且class2和class3不属于同一类,则测试图像属于classl;若classl和class2相同,则测试图像属于classl,而class2与测试图像也是相似的;若class2和class3属于同一类,则测试图像属于class2,而class3与测试图像也是相似的,但classl虽然与测试图像距离最近却不属于同一类,可能是
由测试图像的姿态和饰物引起的。
●贝叶斯分类器
如果知道各类的先验分布和条件分布,就可以采用最大后验估计(MAP)的方法进行分类。在人脸识别中,有时假定人脸服从高斯分布,能够得到不错的结果。
●支撑向量机(SVM)
在小样本情况下,降低了训练集的错分风险,又降低了未知人脸(如检测集)的错分风险。在人脸识别中已逐渐得到应用。
●神经网络分类器(NNC)
采用神经网络作为分类器是很自然的。一般一个3层网络对应模式识别中图像输入、特征提取、分类3部分。通常的NNC有多层感知机(MLP)模型、BP网络、径向基函数网络等。SVM也借鉴了神经网络的思想。
第三章人脸识别系统的设计及实现
3.1人脸识别流程
完成人脸识别的工作需要一系列的步骤,它们结合起来构成一个完整的流程。由于研究人员来自不同的学科、具有不同的背脊,而且不同的人脸识别应用中对识别的目标也不同,所以人脸识别的流程并不统一一个比较通用的人脸识别流程如下图所示:其主要步骤包括:人脸检测/跟踪(face detection/tracking),特征提取(face extraction),特征降维(face dimensionality reduction),匹配识别(matching and classification).它们之间基本上是串行的关系。
(1)人脸检测/跟踪。人脸检测是完成人脸识别工作的自动系统的第一个步骤。该步骤的目的是在输入的图像中寻找人脸区域。具体来说:给定意一幅任图像,人脸检测的目的是确定是否图像州有人脸存在,如果存在,给出每个人脸的具体位置和范围。实际应用中人脸图像的采集或获取常在非受控的条件下进行,这样所得到的图像中的人脸在尺寸、朝向、明暗、遮挡、分辨率等方面都有很多不同,使同一的人脸出现各种变形,并有可能导致各种误识、漏识等失败的情况。为校正人脸在尺度、光照和旋转等方面的变化,常需采用一些包括几何归一化(空间尺度归一化)和光照归一化(灰度幅值归一化)等手段来调整不同的人脸图像,以利于用统一算法进行识别。
(2)特征提取。为区分不同的人脸,需提取各种人脸的独特性质。也就是要从人脸图像中映射提取一组反映人脸特征的数值表示样本。这里首先需要采取某种表示方式来表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵或特征向量)、固定特征模板、特征脸等。
(3)特征降维。人脸是一个非刚性的自然物体(柔性体),从人脸图像中可提取很多不同特征,所以表征人脸的原始特征对应高维空间中的数据(对一幅M*N的图像,空间维数可达M*N)。直接利用这样高维的数据进行识别除需要很多的匹配计算量外,由于很难对各高维数据的描述能力做有效的判断,故还不能保证基于这么多数据进行的识别结果的正确性。在特征提取后,需采用紧凑的人脸表征方式,将原始特征进行筛选组合,集中信息,降低维数,使这些低维空间的有效性的到提高,以有利于接下来的匹配分类。
(4)匹配识别。在特征提取的基础上,选择使当的匹配策略,可将待识别的人脸与数据库中的已知人脸进行匹配比较,建立它们的相关关系,并输出所作出的判断决策/决定(识别结果)。与人脸检测不同,这里利用的主要是人脸个体差异的信息。有两种识别目的和情况需要区别:一种是对人脸图像的验证(verification),即要确认输
入人脸图像中的人是否在数据库中,属于有监督的识别;另一种是对人脸图像的辨识(identification),即要确认输入图像中的人的身份,属于无监督的识别。
3.2 kL变换和PCA人脸识别方法
3.2.1简介
我们希望将图像原特征做某种正交变换,获得的数据都是原数据的线性组合,从新数据中选出少数几个,使其尽可能多地反映各类模式之间的差异,又尽可能相互独立,一个常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)变换或主分量分析(Principal Component Analysis,PCA),这是一种特殊的正交变换,它是重建均方误差最小意义下的最佳变换,起到减少相关性,突出差异性的效果,在图像编码上能去除冗余信息,也常用于一维和二维信号的数据压缩;这种变换采用主要特征对应的特征向量构成变换矩阵,保留原模式样本中方差最大的数据分量,在对高维图像编码时起到了降维作用。由于KL变换和PCA去相关性和降维作用,Mathew A.Turk和P.Pentland首先将主成分分析运用到人脸识别中来。通过K_L变换得到高维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸(Eigenface)方法。
对给定的信号x(n),如果它的各个分量之间完全不相关,那么表示该数据中没有冗余;若x(n)中有相关成分,通过去除其相关性则可达到数据压缩的目的。主成分分析方法(PCA)基本思想是提取出空间原始数据中的主要特征(主元),减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的有用信息,从而解决数据空间维数过高的瓶颈问题。
一个宽平稳的实随机向量x(n)=[[x(0),x(1),…,x(N-1)]T,其协方差矩阵C
x
定义为:
C x =E{(x-μ
x
) (x-μ
x
)T}=
式中E{·}代表求均值运算,μ=E{x}是信号x的均值向量,C
x
的元素
C x (i,j)=E{x(i)-μ
x
}( x(j)-μ
x
)]=C
x
(j,i)
即协方差阵是实对称的。显然,矩阵C
x
体现了信号向量x的各分量之间的相关性。
若x的各分量互不相关,那么C
x
中除对角线以外的元素皆为零。
KL变换的思路是寻求正交矩阵A,使得A对x的变换y的协方差阵C
x
为对角矩阵,其步骤如下:
先由λ的N阶多项式|λI-C
x |=0,求矩阵C
x
的特征值λ
,λ
1
,…λ
N-1
,以及N个特0,00,1
1,01,1
N
N N N
C C
C C
-
---
??
?
?
?
??
征向量A
0,A
1
,…A
N-1
。然后将A
,A
1
,…A
N-1