当前位置:文档之家› SVM原理及在人脸识别中地应用

SVM原理及在人脸识别中地应用

SVM原理及在人脸识别中地应用
SVM原理及在人脸识别中地应用

关于SVM及其应用的相关原理

一、支持向量机介绍

下面我简单介绍下何为小样本、非线性及高维模式识别

小样本,并不是说样本的绝对数量少,实际上,对任何算法来说,更多的样本几乎总是能带来更好的效果,而是说与问题的复杂度比起来,SVM算法要求的样本数是相对比较少的。

非线性,是指SVM擅长应付样本数据线性不可分的情况

高维模式识别是指样本维数很高,例如样本出现几万维,不用降维处理,其他算法基本就没有能力应付了,SVM却可以,主要是因为SVM 产生的分类器很简洁,用到的样本信息很少,使得即使样本维数很高,也不会给存储和计算带来大麻烦。

何为机器学习之后会介绍。

支持向量机方法:

下面我简单介绍下何为VC 维理论和结构风险最小原理以期推广能力所谓VC维是对函数类的一种度量,我们就简单的理解为问题的复杂程度,VC维越高,一个问题就越复杂。

(1)PPT下一页

在讲解结构风险最小原理,先介绍下风险,风险就是与真实解的误差。我举个例子来说,我们不知道宇宙是如何诞生,就是不知道宇宙的真实模型,如果知道真实的宇宙模型,我们直接用真实模型就可

以了。既然不知道,我们就根据一些现象假设认为宇宙诞生于150亿年前的一场大爆炸,这个假设能够描述很多我们观察到的现象,但它与真实的宇宙模型之间还相差多少?谁也说不清,因为我们压根就不知道真实的宇宙模型到底是什么。这个差距我们就认为是风险经验风险就是分类器在给定样本上的误差,就是我们选择一个假设之后,真实误差无从得知,但我们可以用某些可以掌握的量来逼近它。就是使用分类器在样本数据上的分类的结果与真实结果之间的差值来表示。这个差值叫做经验风险。

置信风险是分类器在未知文本上分类的结果的误差。代表了我们在多大程度上可以信任分类器在未知文本上分类的结果。很显然,没有办法精确计算的,因此只能给出一个估计的区间,也使得整个误差只能计算上界,而无法计算准确的值。

结构风险就是经验风险与置信风险之和

(2)PPT下一页

下面介绍下机器学习和推广能力

机器学习就是对一种对问题真实模型的逼近。机器学习分为传统机器学习和统计机器学习。

传统机器学习方法是把经验风险最小化作为努力的目标,但后来发现很多分类函数能够在样本集上轻易达到100%的正确率,然而用

分类函数对未知样本分类时却一塌糊涂。经验风险最小化原则适用的大前提是经验风险要确实能够逼近真实风险才行,但实际上能逼近么?答案是不能,因为样本数相对于现实世界要分类的文本数来说简直九牛一毛,经验风险最小化原则只在这占很小比例的样本上做到没有误差,当然不能保证在更大比例的真实文本上也没有误差。所以传统的机器学习基本上属于摸着石头过河,用传统的机器学习方法构造分类系统完全成了一种技巧,一个人做的结果可能很好,另一个人差不多的方法做出来却很差,缺乏指导和原则。

统计统计机器学习目标是从经验风险最小化变为了寻求经验风险与置信风险的和最小

而推广能力就是,用已知样本得到的一个分类器,在其他未知样本分类时候也能获得很好的正确率。

(3)PPT下一页——SVM基础

大家可以看上图,我们要区分C1和C2 这两类,红色的曲线可以区分出来,但是用线性函数进行区分是最简单也很有效的. 我将用一个二维空间里仅有两类样本的分类问题来举例,来说明SVM的形成思路与核心概念

何为线性可分与线性不可分,C1和C2是要区分的两个类别,如

图所示。中间的直线就是一个分类函数,它可以将两类样本完全分开。一般的,如果一个线性函数能够将样本完全正确的分开,就称这些数据是线性可分的,否则称为非线性可分的。

线性函数在一维空间里就是一个点,在二维空间里就是一条直线,三维空间里就是一个平面,如此想象下去,如果不关注空间的维数,这种线性函数一个统一的名称即为超平面

下面我们要区分C1,C2可以得到得到一个线性函数 g(x)=wx+b 如取阈值为0,当有一个样本x i需要判别的时候。若g(x i)>0,就判别为类别C1,若g(x i)<0,则判别为类别C2。很容易区分出样本是属于C1还是C2

(4)PPT下一页

关于线性函数g(x)=wx+b要注意,式中的x不是二维坐标系中的横轴,而是样本的向量表示,例如一个样本点的坐标是(3,8),则x 是向量(3,8) ,而不是x=3,第二点是这个形式并不局限于二维的情况,在n维空间中仍然可以使用这个表达式,只是式中的w成为了n 维向量;三是,g(x)不是中间那条直线的表达式,中间那条直线的表达式是g(x)=0,即wx+b=0,我们也把这个函数叫做分类面。

实际上很容易看出来,中间那条分界线并不是唯一的,如图中的绿线和红线,甚至很多线都可以将C1,C2分类出来并且不会分错。哪一个线性函数更好呢?显然必须要先找一个指标来量化“好”的程度,通常使用的都是叫做“几何间隔”的指标。

(5)PPT下一页

在进行文本分类的时候,我们可以让计算机这样来看待我们提供给它的训练样本,每一个样本由一个向量和一个标示出这个样本属于哪个类别的标记组成。记作如下:

Di=(xi,yi)

xi就是文本向量(维数很高),yi就是分类标记。

在二元的线性分类中,这个表示分类的标记只有两个值,1和-1用来表示属于还是不属于C1。

有了这种表示法,我们就可以定义一个样本点到某个超平面的间隔:δi=yi(wxi+b) 此公式只是一个定义,没有什么道理。

我们看这公式(1),如果某个样本属于C1该类别的话,那么

wxi+b>0,而yi=1也大于0;若不属于该类别的话,那么wxi+b<0,而yi也小于0,这意味着δi总是大于0的,而且它的值就等于

|wxi+b|

现在把w和b进行一下归一化,即用w/||w||和b/||w||分别代替原来的w和b,那么间隔就可以写成

对于2维,||w||就是2-范数。当不是2维空间时候,w就是n 范数

之所以如此关心几何间隔,是因为几何间隔越大,误差上界越小,置信风险越小。因为支持向量机是要求结构风险最小,那么就是经验风险和置信风险越小越好。所以我们希望几何间隔越大越好。(6)PPT下一页

如图,展示出了几何间隔的现实含义, H是分类面就是g(x)=0,而H1和H2是平行于H,H1与H,H2与H之间的距离就是几何间隔。要求几何间隔最大就是右边公式中

最大。而我们常用的方法并不

i

是固定||w||的大小而寻求最大几何间隔,而是固定几何间隔,例如固定几何间隔为1,寻找最小的||w||。

得到目标函数就是:

这个式子和求min||w||是等价的,用此形式只是之后推导计算方便

如果直接来解这个求最小值问题,很容易看出当||w||=0的时候就得到了目标函数的最小值。但,无论你给什么样的数据,都是这个解!反映在图中,就是H1与H2两条直线间的距离无限大,这个时候,所有的样本点都跑到了H1和H2中间,没有将C1和C2类区分出来。

所以我要加入约束条件来,之前提到过将几何距离固定为1,这是指把所有样本点中间隔最小的那一点的间隔定为1,也就意味着集合中的其他点间隔都不会小于1,按照间隔的定义,满足这些条件就相当于让下面的式子总是成立:

yi[(w·xi)+b]≥1 (i=1,2,…,n) (n是总的样本数)这样我们的两类样本分类问题也被我们转化成了它的数学形式,一个带约束的最小值的问题:

(7)PPT下一页

几何间隔告诉了我们如何在g(x)=wx+b中选择一个最好的。但是我们还要知道如何求出一个g(x)=wx+b。后面这个为内积形式求这样的g(x)的过程就是求w(一个n维向量)和b(一个实数)两个参数的过程,但实际上只需要求w,求得以后找某些样本点代入就可以求得b。因此在求g(x)的时候,w才是变量。一旦求出了w,

那么中间的直线H就知道了,因为它就是wx+b=0,H,H1,H2平行,间隔||w||,则H1和H2可以求的。

那么w是谁决定的?显然是你给的样本决定的,一旦你在空间中给出了那些个样本点,三条直线的位置实际上就唯一确定了,因为我们求的是最优的那三条,当然是唯一的

样本确定了w,用数学的语言描述,就是w可以表示为样本的某种组合:

w=α1x1+α2x2+…+αn x n

式子中的αi是拉格朗日乘子,而x i是样本点,是向量,n就是总样本点的个数。

但是(1)式还不够好,并不能表示样本的全部信息,我们看图,如果把其中一个正样本点定为负样本点,就是把一个圆形变为方形三条直线都必须移动。这说明w不仅跟样本点的位置有关,还跟样本的类别有关。因此用带有标记的w式子才完整

w=α1y1x1+α2y2x2+…+αn y n x n

其中的y i就是第i个样本的标签,它等于1或者-1。

(7)PPT下一页

我们来看这个w的等式,式的那一堆拉格朗日乘子中,只有很少

的一部分不等于0,不等于0才对w 起决定作用,这部分不等于0的拉格朗日乘子后面所乘的样本点,都落在H1和H2上,也正是这部分样本唯一的确定了分类函数,当然,更严格的说,这些样本的一部分就可以确定,因为例如要确定H1这条直线,只需要两个点就可以,即便有三五个都落在H1上面。这部分我们真正需要的样本点,就叫做支持(撑)向量!形象的理解为,“撑”起了分界线的样本。

将w 用求和符号简写一下:

g(x)表达式可以写为:

11(),(),,n

i i i i n i i i i g x w x b a y x b

a y x b

x x ===<>+=<>+=<>+∑∑

注意式子中x 才是变量,也就是你要分类哪篇文档,就把该文档的向量表示代入到 x 的位置,而所有的x i 统统都是已知的样本。式

子中只有x i 和x 是向量,所以可以表示为后面的式子。之所以表示为

(1)式形式,是因为以这样的形式描述问题以后,我们的优化问题

少了很大一部分不等式约束。我们先不讨论这个等式如何求解,先讲解下支持向量机的最重要的部分——核函数和松弛变量

(7)PPT 下一页——核函数

之前一直在讨论的线性分类器,只能对线性可分的样本做处理。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必然使得它的适用范围大大缩小,而它的很多优点我们实在不原意放弃,怎么办呢?有,其思想很简单,还是用二维平面中的分类问题作例子。左边的我们把横轴上红色部分里的所有点定为正类,两边的黑色部分里的点定为负类。试问能找到一个线性函数把两类正确分开么?在二维空间里的线性函数就是指直线,显然找不到能将两者分开的直线。我们可以找到一条曲线将二者区分开,通过判断点在这条曲线的上方还是下方就可以判断点所属的类别。得到曲线为2012()g x c c x c x =++,问题只是它不是一个线性函

数,但是新建一个向量y 和a ,11022123321,y a c y y x a a c y x a c ?????????

???????====????????????????????????

,然后把y 和a 分别回带一下,得到g(x)=f(y)=ay 。在任意维度的空间中,这种形式的函数都是一个线性函数,只不过其中的a 和y 都是多维向量罢了。这样原来在二维空间中一个线性不可分的问题,映射到四维空间后,变成了线性可分的!因此这也形成了我们最初想解决线性不可分问题的基本思路——向高维空间转化,使其变得线性可分。

(7) P PT 下一页

将低维空间线性不可分的映射到的高维空间的到的线性可分的线性函数为

f(x’)=+b

其中:x’是经由x变换来的, w’是经由w变换来的

计算高维空间向量x’与向量w’的内积,再把这个内积的值和b相加,就得到了结果,看结果大于阈值还是小于阈值就得到了分类结果。但是x’到x, w’到w的映射关系很难找到。但是我们发现我们可以只关心那个高维空间里内积的值,如果内积值算出来了,分类结果就算出来了。这就让我们幻想,是否能有这样一种函数K(w,x),他接受低维空间的输入值,却能算出高维空间的内积值?如果存在K(w,x),那么当给了一个低维空间数据,

g(x)=K(w,x)+b

f(x’)=+b

这两个函数的计算结果就完全一样,我们可直接拿低维的输入往g(x)里面代就可以了。万幸的是,这样的K(w,x)确实存在,它被称作核函数,而且还不止一个。

(8)P PT下一页

核函数的基本作用就是接受两个低维空间里的向量,能够计算出经过某个变换后在高维空间里的向量内积值。之前我们经过化简得到

一个线性表示

'

1

'

'

(),

n

i i i

i

g x a x

y x b

=

=<>+

现在这个就是高维空间里的线性函数,我们就可以用一个低维空间里的函数来代替,之前有介绍核函数是输入低纬数据之间计算出高维空间的内积值得到,低纬空间的代替函数

可以看到g(x’) 和g(x)里的α,y,b全都是一样的!这就是说,尽管给的问题是线性不可分的,但是我们就硬当它是线性问题来求解,只不过求解过程中,凡是要求内积的时候就用你选定的核函数来算。这样求出来的α再和你选定的核函数一组合,就得到分类器。

PPT下一页

根据上面的核函数介绍会想到下面两个问题

1.既然有很多的核函数,针对具体问题该怎么选择?

2.如果使用核函数向高维空间映射后,问题仍然是线性不可分的,那怎么办?

第一个,对核函数的选择,现在还缺乏指导原则!各种实验的观察结果表明,某些问题用某些核函数效果很好,用另一些就很差,但是一般来讲,径向基核函数是不会出太大偏差的一种,首选。这里我们不讨论径向基核函数具体实现形式是什么样子,只要知道他是一个较好实现输入低维空间数据得到高维空间内积的函数。

第二个问题的解决则引出了我们下一节的主题:松弛变量。

(10)PPT 下一页

如图所示,在分类过程中出现图中情况,就是图中黄色那个点,它是方形的,因而它是负类的一个样本,这单独的一个样本,使得原本线性可分的问题变成了线性不可分的。

以我们人类的常识来判断,说有一万个点都符合某种线性可分的规律,有一个点不符合,其实我们会觉得,这个样本点压根就是错误,是噪声,而不是我们分类方法有问题。所以我们会简单的忽略这个样本点,仍然使用原来的分类器,其效果丝毫不受影响。

为了使我们的约束条件也有这种对噪声的容错性,我们将原来的约束条件右边的阈值1增加一个松弛变量,如下:

·11,2,[,(0)]()i i yi w xi b i n n ζζ+≥-=?≥(是总的样本数) 因为松弛变量是非负的,因此最终的结果是要求间隔可以比1小。但是当某些点出现这种间隔比1小的情况时(这些点也叫离群点),

意味着我们放弃了对这些点的精确分类,而这对我们的分类器来说是种损失。但是放弃这些点也带来了好处,那就是使分类面不必向这些点的方向移动,因而可以得到更大的几何间隔。

显然我们必须权衡这种损失和好处。回顾下我们原始的优化问题

||w||2就是我们的目标函数,希望它越小越好,我们引入松弛变量带来的损失就必然是一个能使之变大的量,能使它变小就不叫损失了,因为我们本来就希望目标函数值越小越好。

(11)PPT下一页

我们如何来衡量松弛变量给目标函数带来的损失呢?常用kesai 平方求和或者kesai求和来衡量,n为样本数目,这两个没有本质区别。如果选择了(1)式,得到的方法的就叫做二阶软间隔分类器,(2)式就叫做一阶软间隔分类器。

我先解释下什么叫软间隔,

我们看约束条件右边是我们给的一个固定的阈值1,我们称这个为“硬间隔”分类法,因为他硬性的要求所有样本点都满足和分类平面间的距离必须大于某个值。而带有松弛变量的(2)式,就属于软间隔分类方法

PPT 下一页

把损失加入到目标函数里的时候,就需要一个惩罚因子Ci ,原来的优化问题就变成了下面这样:

21

1min 2[()]1(1,2,...,)()

n i i i i i i i w C subject to y wx b n i n ζζζ=++≥-=≥∑是总的样本数对这个式子有这么几点要注意:

一是并非所有的样本点都有一个松弛变量与其对应。实际上只有“离群点”才有,或者也可以这么看,所有没离群的点松弛变量都等于0。

二是松弛变量的值实际上标示出了对应的点到底离群有多远,值越大,点就越远。

三是惩罚因子Ci 决定了你有多重视离群点带来的损失,显然当所有离群点的松弛变量的和一定时,你定的C 越大,对目标函数的损失也越大,此时就暗示着你非常不愿意放弃这些离群点,最极端的情况是你把C 定为无限大,这样只要稍有一个点离群,目标函数的值马上变成无限大,马上让问题变成无解,这就退化成了硬间隔问题。

四是惩罚因子C 不是一个变量,整个优化问题在解的时候,C 是一个你必须事先指定的值,指定这个值以后,解一下,得到一个分类

器,然后用测试数据看看结果怎么样,如果不够好,换一个C的值,再解一次优化问题,得到另一个分类器,再看看效果,如此就是一个参数寻优的过程。

至此一个比较完整的支持向量机框架就有了,简单说来,支持向量机就是使用了核函数的软间隔线性分类法。

最后,我要说的是,虽然我是以两类样本进行分类来介绍SVM的原理,其实SVM是可以用到多类样本分类的。(11)PPT下一页——总结

最后,我来总结下我所讲。。

我们的问题是要想办法分类C1,C2。因为线性分类器最简单最高效,所以我们用线性函数对其分类,

但是,有很多线性函数,我们利用几何间隔选取最优的线性函数

如果C1,C2不是线性可分的。我们利用核函数将2维的数据转换为更高维空间,使其变成线性可分数据。

如果出现少量离群点导致数据不可分,我们利用松弛变量将离群点舍去使得数据再次变成线性可分的

(11)PPT下一页

下面我们来讲解下支持向量机的应用,因为已经理解支持向量机是一种线性分类方法。辨别图片以区别人脸和猴脸为例说明下支持向量机在其中的应用。比如我们有100张人脸照片用A表示和100张猴脸照片用B表示。其中我们把前80张人脸和80张猴脸图片作为训练图片。剩余的20张人脸和20张猴脸作为测试图片。训练图片和测试图片具体选多少没有规定,但是测试图片和训练图片都是已知样本数据。

(11)PPT下一页——总结

区别是猴脸还是人脸要对图片的特征信息进行提取,我们不考虑如何提取到的特征信息,只是特征信息都是用同一种方法提取并且得到的维数相同。

我们用相同的方法,将训练图片和测试图片全部进行特征提取并组成一个大矩阵 H和H,矩阵每一行代表每一个样本,每一列代表每

个样本的一个特征值,H前80行代表人脸数据,后80行代表猴脸数据。后面的数字1,2是一种标记,1表示图片是人脸,2表示图片是猴脸

我们将训练图片H矩阵利用支持向量机进行分类,我们不在细究是利用了什么核函数,松弛变量是怎么选择,总之,我们认为计算机已经训练好了,已经有了一个分类的线性函数,能够将猴脸和人脸区分出来。

然后将测试图片H,用这个分类函数进行分类。会得到分类函数对测试图片的分类结果矩阵S,比如,有两个分类错误了,A的第100张图片本来应该是人脸,但是这个分类函数把他分成了猴脸,B的第80张图应该是猴脸缺分成了人脸。这样就可以计算下当前分类函数的分类准确率。38/40=95%..。。如果比较低则,再重新将H重新输入到SVM中重新训练。

如果准确率可以,则选用当前分类函数为最终的分类函数,这样当给了一张新的图片,就可以用当前分类函数对新图片进行人脸还是猴脸的辨别了。

人脸识别系统的原理与发展

人脸识别系统的原理与发展 一、引言 人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析算法,融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景。2012年4月,铁路部门宣布车站安检区域将安装用于身份识别的高科技安检系统人脸识别系统;可以对人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大; 二、概述 人脸识别系统概述 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。 人脸识别系统功能模块 人脸捕获与跟踪功能:人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。 人脸识别比对:人脸识别分核实式和搜索式二种比对模式。核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。搜索式的比对是指,从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。 人脸的建模与检索:可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板(人脸特征文件)保存到数据库中。在进行人脸搜索时(搜索式),将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。

人脸识别实验报告

人脸识别——特征脸方法 贾东亚12346046 一、实验目的 1、学会使用PCA主成分分析法。 2、初步了解人脸识别的特征法。 3、更熟练地掌握matlab的使用。 二、原理介绍 1、PCA(主成分分析法介绍) 引用一个网上的例子。假设有一份对遥控直升机操作员的调查,用x1(i)表示飞行员i的 飞行技能,x2(i)表示飞行员i喜欢飞行的程度。通常遥控直升飞机是很难操作的,只有那些 非常坚持而且真正喜欢驾驶的人才能熟练操作。所以这两个属性x1(i)和x2(i)相关性是非常强的。我们可以假设两者的关系是按正比关系变化的。如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声。 现在我们有两项数据,是二维的。那么如何将这两项变量转变为一个来描述飞行员呢?由图中的点的分布可知,如果我们找到一个方向的U,所有的数据点在U的方向上的投影之 和最大,那么该U就能表示数据的大致走向。而在垂直于U的方向,各个数据点在该方向的投影相对于在U上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U方向上的一维数据。 为了将u选出来,我们先对数据进行预处理。先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身。然后对数据归一化以后,再代替数据本身。 而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大。而XT u 就是投影的距离。故我们要求下式的最大值: 1 m ∑(x(i)T u)2=u T( 1 m ∑x(i)x(i)T m i=1 ) m i=1 u 按照u是单位向量来最大化上式,就是求1 m ∑x(i)x(i)T m i=1的特征向量。而此式是数据集的 协方差矩阵。

人脸识别主要算法原理

人脸识别主要算法原理 主流的技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的基础。 3. 特征脸方法(Eigenface或PCA)

基于opencv的人脸识别程序-代码详解

#include "cv.h" #include "highgui.h" #include #ifdef _EiC #define WIN32 #endif static CvMemStorage* storage = 0; static CvHaarClassifierCascade* cascade = 0; void detect_and_draw( IplImage* image ); const char* cascade_name = "haarcascade_frontalface_alt.xml";//人脸检测分类器 int main( int argc, char** argv ) { CvCapture* capture = 0; IplImage *frame, *frame_copy = 0; int optlen = strlen("--cascade="); const char* input_name; if( argc > 1 && strncmp( argv[1], "--cascade=", optlen ) == 0 ) { cascade_name = argv[1] + optlen; input_name = argc > 2 ? argv[2] : 0; } else { cascade_name = "E:\毕业设计\智能机器人动态人脸识别系统\陈建州程序.xml";//分类器路径 input_name = argc > 1 ? argv[1] : 0; } cascade = (CvHaarClassifierCascade*)cvLoad( cascade_name, 0, 0, 0 ); if( !cascade )//如果没有找到分类器,输出以下 { fprintf( stderr, "ERROR: Could not load classifier cascade\n" ); fprintf( stderr, "Usage: facedetect --cascade=\"\" [filename|camera_index]\n" ); return -1;

SVM原理及在人脸识别中地应用

关于SVM及其应用的相关原理 一、支持向量机介绍 下面我简单介绍下何为小样本、非线性及高维模式识别 小样本,并不是说样本的绝对数量少,实际上,对任何算法来说,更多的样本几乎总是能带来更好的效果,而是说与问题的复杂度比起来,SVM算法要求的样本数是相对比较少的。 非线性,是指SVM擅长应付样本数据线性不可分的情况 高维模式识别是指样本维数很高,例如样本出现几万维,不用降维处理,其他算法基本就没有能力应付了,SVM却可以,主要是因为SVM 产生的分类器很简洁,用到的样本信息很少,使得即使样本维数很高,也不会给存储和计算带来大麻烦。 何为机器学习之后会介绍。 支持向量机方法: 下面我简单介绍下何为VC 维理论和结构风险最小原理以期推广能力所谓VC维是对函数类的一种度量,我们就简单的理解为问题的复杂程度,VC维越高,一个问题就越复杂。 (1)PPT下一页 在讲解结构风险最小原理,先介绍下风险,风险就是与真实解的误差。我举个例子来说,我们不知道宇宙是如何诞生,就是不知道宇宙的真实模型,如果知道真实的宇宙模型,我们直接用真实模型就可

以了。既然不知道,我们就根据一些现象假设认为宇宙诞生于150亿年前的一场大爆炸,这个假设能够描述很多我们观察到的现象,但它与真实的宇宙模型之间还相差多少?谁也说不清,因为我们压根就不知道真实的宇宙模型到底是什么。这个差距我们就认为是风险经验风险就是分类器在给定样本上的误差,就是我们选择一个假设之后,真实误差无从得知,但我们可以用某些可以掌握的量来逼近它。就是使用分类器在样本数据上的分类的结果与真实结果之间的差值来表示。这个差值叫做经验风险。 置信风险是分类器在未知文本上分类的结果的误差。代表了我们在多大程度上可以信任分类器在未知文本上分类的结果。很显然,没有办法精确计算的,因此只能给出一个估计的区间,也使得整个误差只能计算上界,而无法计算准确的值。 结构风险就是经验风险与置信风险之和 (2)PPT下一页 下面介绍下机器学习和推广能力 机器学习就是对一种对问题真实模型的逼近。机器学习分为传统机器学习和统计机器学习。

人脸识别文献综述

文献综述 1 引言 在计算机视觉和模式识别领域,人脸识别技术(Face Recognition Technology,简称FRT)是极具挑战性的课题之一。近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。 虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。 自动人脸识别可以表述为:对给定场景的静态或视频序列图像,利用人脸数据库验证、比对或指认校验场景中存在的人像,同时可以利用其他的间接信息,比如人种、年龄、性别、面部表情、语音等,以减小搜索范围提高识别效率。自上世纪90年代以来,人脸识别研究得到了长足发展,国内外许多知名的理工大学及TT公司都成立了专门的人脸识别研究组,相关的研究综述见文献[1-3]。 本文对近年来自动人脸识别研究进行了综述,分别从人脸识别涉及的理论,人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理,并对具有典型意义的方法进行了较为详尽的分析对比。此外,本文还分析介绍了当前人脸识别的优势与困难。 2 人脸识别相关理论 图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像。要建立一套完整的人脸识别系统(Face Recognetion System,简称FRS),必然要综合运用以下几大学科领域的知识: 2.1 数字图像处理技术 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机

[作业]OPENCV人脸识别

摘要 人脸检测主要是基于计算机识别的一项数字化技术,用以准确获取人的脸部大小和位置信息,在进行人脸检测时,突出主要的脸部特征,淡化次要的环境、衣着等因素。对于某些情况下,人脸检测也可以计算出人脸,如眼睛,鼻子和嘴等精确的微妙特征。由于在安全检测系统,医学,档案管理,视频会议和人机交互等领域人脸检测系统都有光明的应用前景,因此人脸检测逐渐成为了两个跨学科领域研究的热门话题:人工智能和当前模式识别。本文基于OpenCV视觉库具体的设计并开发了对数字图像中的人脸检测的程序,所采用的人脸检测的原理主要是分类器训练模式(Adaboost算法)提取Haar特征的方法。它在整个软件极其重要的作用,图像中人脸的准确定位和识别都受图像处理好坏的直接影响。本次所设计的软件在图像处理部分所采用的方法是基于Adaboost算法进行Haar特征的提取,在此之上加以通过积分图方法来获取完整的级联分类器结构,进行人脸检测时,OpenCV级联分类器通过Adaboost人脸检测算法进行训练,此后采用不同情况下的实验样本完成精确定位以及检测试验。经过代码的设计和调试,在最后的测试中针对数字图像进行的人脸检测和定位达到了较好的效果,提高了定位和识别的正确率。 关键词:人脸检测,AdaBoost,分类器,OpenCV

Abstract Face detection is mainly based on computer recognition of a digital technology,face size and location information to accurately obtain the person,during face detection, highlight the main facial features,dilute the secondary environment,clothing,and other factors.For some cases,face detection can also calculate a person's face,such as eyes, nose and mouth,and other subtle features accurate.Because in the field of human security detection systems,medical records management,video conferencing,and human-computer interaction face detection system has bright prospects,and therefore face detection is becoming a two interdisciplinary research fields hot topic:artificial intelligence and The current pattern recognition.This article is based.penCV vision library designed and developed specifically for digital image face detection process,the principles used face detection methods are mainly classifier training mode(Adaboost algorithm)to extract Haar features.It is in the vital role of the software,the image of the human face accurately locate and identify all that is good or bad a direct impact on the image processing.This software is designed image processing method used in part based Haar Adaboost algorithm to extract features,on top of this to be to get the full cascade classifier structure by integrating the diagram method for face detection,OpenCV cascade classifier is trained by Adaboost face detection algorithm,then the use of the experimental sample under different circumstances for accurate positioning and testing.Through design and debugging code,face detection and location in the final test for digital images to achieve better results and improve the accuracy of positioning and recognition. Keywords:face detection;AdaBoost;classifier;openCV

人脸识别几种解决方案的对比_人脸识别技术原理介绍

人脸识别几种解决方案的对比_人脸识别技术原理介绍 人脸识别概要人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。人脸识别特点非强制性:用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有强制性; 非接触性:用户不需要和设备直接接触就能获取人脸图像; 并发性:在实际应用场景下可以进行多个人脸的分拣、判断及识别; 除此之外,还符合视觉特性:以貌识人的特性,以及操作简单、结果直观、隐蔽性好等特点。 人脸识别技术原理分析人脸识别主要分为人脸检测(face detecTIon)、特征提取(feature extracTIon)和人脸识别(face recogniTIon)三个过程。 人脸检测:人脸检测是指从输入图像中检测并提取人脸图像,通常采用haar特征和Adaboost算法训练级联分类器对图像中的每一块进行分类。如果某一矩形区域通过了级联分类器,则被判别为人脸图像。 特征提取:特征提取是指通过一些数字来表征人脸信息,这些数字就是我们要提取的特征。常见的人脸特征分为两类,一类是几何特征,另一类是表征特征。几何特征是指眼睛、鼻子和嘴等面部特征之间的几何关系,如距离、面积和角度等。由于算法利用了一些直观的特征,计算量小。 不过,由于其所需的特征点不能精确选择,限制了它的应用范围。另外,当光照变化、人脸有外物遮挡、面部表情变化时,特征变化较大。所以说,这类算法只适合于人脸图像的粗略识别,无法在实际中应用。 表征特征利用人脸图像的灰度信息,通过一些算法提取全局或局部特征。其中比较常用的特征提取算法是LBP算法。LBP方法首先将图像分成若干区域,在每个区域的像素640x960邻域中用中心值作阈值化,将结果看成是二进制数。

人脸识别技术原理解析

人脸识别技术原理解析 你还记得电影里的这些情节吗?《变形金刚2》中,年轻的男主角和他的小伙伴们过关卡时,虽然骗过了值班军人,却被军方的人脸识别技术发现。2014年翻拍版的《机械战警》中,机械战警第一次面对大众公开亮相,就在人群中不停地扫描所有人脸,同时将获取的人脸在通缉犯资料库中作比对,瞬间就发现看热闹的人群中有一个逃逸多年的通缉犯,并将其制服。其他还有许多电影中,但凡是美国的机要部门,进门就要扫描各种生物特征,从早年电影中的指纹、虹膜,到现在的人脸。 人脸识别到底是什么? 人脸识别,是视觉模式识别的一个细分问题,也大概是最难解决的一个问题。其实我们人每时每刻都在进行视觉模式识别,我们通过眼睛获得视觉信息,这些信息经过大脑的处理被识别为有意义的概念。于是我们知道了放在我们面前的是水杯、书本,还是什么别的东西。 我们也无时无刻不在进行人脸识别,我们每天生活中遇到无数的人,从中认出那些熟人,和他们打招呼,打交道,忽略其他的陌生人。甚至躲开那些我们欠了钱还暂时还不上的人。然而这项看似简单的任务,对机器来说却并不那么容易实现。 对计算机来讲,一幅图像信息,无论是静态的图片,还是动态视频中的一帧,都是一个由众多像素点组成的矩阵。比如一个1080p的数字图像,是一个由1980*1080个像素点组成矩阵,每个像素点,如果是8bit的rgb格式,则是3个取值在0-255的数。 机器需要在这些数据中,找出某一部分数据代表了何种概念:哪一部分数据是水杯,哪一部分是书本,哪一部分是人脸,这是视觉模式识别中的粗分类问题。 而人脸识别,需要在所有机器认为是人脸的那部分数据中,区分这个人脸属于谁,这是个细分类问题。 人脸可以分为多少类呢? 取决于所处理问题的人脸库大小,人脸库中有多少目标人脸,就需要机器进行相应数量的细分类。如果想要机器认出每个他看到的人,则这世界上有多少人,人脸就可以分为多少

人脸识别技术的应用

人脸识别技术的应用 面部识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。人脸因具有不可复制、采集方便、不需要被拍者的配合而深受欢迎。现如今,人脸识别这个词已经慢慢走进了我们的生活,开始逐渐广泛的应用到日常生活之中。 手机、笔记本电脑中的人脸识别软件就是一个很好的例子,它帮助我们解锁手机、电脑,无需再输入密码,不用担心密码泄露从而导致的信息隐私泄露,它很好的帮助我们保护手机、电脑的安全。除此之外,人脸识别门禁系统开始应用于一些高档住宅和办公楼中,为人们省去了带钥匙刷卡的麻烦,也不用担心密码忘记的苦恼。人脸识别考勤机也开始被一些企业应用于日常管理。而一些美颜相机、美图软件的推出跟迎合了消费者的市场。它可以自动识别人脸,并对人脸进行美化。甚至一些小游戏被开发出来,可以将自己的脸与明星的脸比对相似之处,评价出你最有有谁的明星相。虽然这仅仅是一个游戏软件,只是供人们娱乐,真实度不高,但也可以看出现今人脸识别技术的广泛使用。 人脸识别技术在过去几年中得到了广泛的关注,正是因为它的应用程序涵盖了许多不同的领域。对于许多的应用程序来说,脸部识别系统的性能在可控的环境下已经达到了一个令人满意的水平。但是现有的大部分面部识别技术在不受控制的环境下识别性能明显下降。 在这次第十四届KSS国际知识与系统科学研讨会中,教授为我们介绍了如何在面部识别中应对不同光照环境下的情况。在过去几年中,处理不同光照的方法主要有: 1. histogram equalization. 2.logarithm transformations. 3.Apply DCT in the logarithm domain. 4.QI (Quotient Image). 5.SQI(Self-Quotient Image). 6.MQI (Morphological Quotient Image). 7.Local binary patterm operator. 经过了他们团队的研究,将这几种进行对照比较,建立一个PSO-SQI框架,利用算法的性能处理人脸识别中的光照问题。 PSO算法是一个新的基于群体智能的进化算法,其研究远没有像遗传算法和模拟退火算法那样深入,在理论上并不能保证能够得到最优解。PSO算法在进行优化问题的求解时应用范围有限,尤其对离散的组合优化问题,其理论建模还处于起步阶段。PSO算法中的一些参数,如学习因子、惯性权重以及粒子个数往往根据有限的应用经验确定,并不具有广泛的适应性。 而SQI是指自商图像(self-quotient image),以提取一个目标(如人脸)图像的内在特性,同时去除与光照相关的外在因素.SQI (self-quotient image) 方法克服了原始的QI 方法的局限性,且能够提取与光照无关的内在特性.对算法适用的条件进行了理论分析,并在SQI 计算过程中提出了一个非迭代的各向异性滤波器以减小光晕现象和提高计算速度.实验结果表明该方法可以有效地提高不同光照条件下的人脸识别系统的识别率. 由着POS-SQI两种方法的结合,更好的处理了人脸识别在不可控的光线下识

中科院模式识别大作业——人脸识别

人脸识别实验报告 ---- 基于PCA 和欧氏距离相似性测度 一、理论知识 1、PCA 原理 主成分分析(PCA) 是一种基于代数特征的人脸识别方法,是一种基于全局特征的人脸识别方法,它基于K-L 分解。基于主成分分析的人脸识别方法首次将人脸看作一个整体,特征提取由手工定义到利用统计学习自动获取是人脸识别方法的一个重要转变[1]。简单的说,它的 原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表示为一个低维向量,并不会损失任何信息。即通过低维向量和特征向量矩阵,可以完全重构出所对应的原来高维向量。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此,可以采用K-L 变换获得其正交K-L 基底。对应其中较大特征值的基底具有与人脸相似的形状,因此又称为特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征空间中的位置,从而进行判别。 2、基于PCA 的人脸识别方法 2.1 计算特征脸 设人脸图像f(x,y)为二维N×M 灰度图像,用NM 维向量R 表示。人脸图像训练集为{}|1,2,...,i R i P =,其中P 为训练集中图像总数。这P 幅图像的平均向量为: _ 11P i i R R P ==∑ 对训练样本规范化,即每个人脸i R 与平均人脸_ R 的差值向量: i A =i R -_R (i= 1,2,…,P) 其中列向量i A 表示一个训练样本。 训练图像由协方差矩阵可表示为: T C AA = 其中训练样本NM ×P 维矩阵12[,,...,]P A A A A = 特征脸由协方差矩阵C 的正交特征向量组成。对于NM 人脸图像,协方差矩

基于OpenCV的视频人脸识别系统的设计与实现

摘要 基于生物特征识别的身份认证方法和系统研究一直以来都是计算机图形学和模式识别领域研究的热点,其中,由于人脸的稳定性和可见性,针对人脸识别的算法研究和系统应用最为广泛,本文针对校园内实验室和宿舍安全管理需求,设计和实现了一套针对监控视频的基于OpenCV的人脸识别原型系统,开发语言选用C++,全文内容包括: (1)构建了基于OpenCV的视频人脸识别的技术框架。针对实验室和宿舍安全管理需要,构建了基于OpenCV的视频人脸识别的技术框架,能够完成基于视频的实时人脸识别和身份认定; (2)设计了基于OpenCV的视频人脸快速检测算法。人脸检测是人脸识别的前提,本文采用基于OpenCV的快速人脸检测算法实现视频图像中人脸的快速定位和提取; (3)设计了基于AdaBoost算法的视频人脸识别方法。应用AdaBoost算法实现了针对视频流的快速人脸定位和身份识别,能够实现实时身份认定。 系统基于.NET平台设计,使用C++语言进行实现,完成了基于视频的实时人脸身份认定。 关键词:人脸检测; OpenCV;人脸识别; C++; 1

Abstract Based on the research of identity authentication method and system of biometric recognition has been a hot research field of computer graphics, pattern recognition and the stability and visibility, the face, the algorithm research and system applications of face recognition is the most widely, according to the laboratory and dormitory safety management needs of the campus, designed and implemented. A face recognition system based on OpenCV in surveillance video, development language is C++, the main content of this thesis includes: (1)Constructed the technical framework for video based face recognition based on OpenCV. According to the laboratory and the dormitory safety management needs, establishes a framework for video based face recognition based on OpenCV, which can complete real-time face recognition and identity based on video identification; (2)Design of a fast face detection algorithm in video based on OpenCV. Face detection is the precondition of face recognition, this paper uses OpenCV fast face detection algorithm to locate face in video image and extraction based on;The design use application of OpenCV to provide strong support, based https://www.doczj.com/doc/083997023.html, platform design. (3)Design of video based face recognition method based on AdaBoost algorithm. Application of AdaBoost algorithm for fast face location and recognition of video stream, which can realize real-time identification. System based https://www.doczj.com/doc/083997023.html, platform design, implementation is carried out using C++ language, completed the real-time face identity recognition based on video Key word:Face detection;OpenCV;Face recognition;C++;

论文:人脸识别系统的原理与发展

人脸识别系统的原理与发展 摘要 人脸识别因其在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、系统公安(罪犯识别等)等方面的巨大应用前景而越来越成为当前模式识别和人工智能领域的一个研究热点。 本文提出了基于24位彩色图像对人脸进行识别的方法,介绍的主要内容是图像处理,它在整个软件中占有极其重要的地位,图像处理的好坏直接影响着定位和识别的准确率。本软件主要用到的图像处理技术是:光线补偿、高斯平滑和二值化。在识别前,先对图像进行补光处理,再通过肤色获得可能的脸部区域,最后根据人脸固有眼睛的对称性来确定是否就是人脸,同时采用高斯平滑来消除图像的噪声,再进行二值化,二值化主要采用局域取阈值方法,接下来就进行定位、提取特征值和识别等操作。经过测试,图像预处理模块对图像的处理达到了较好的效果,提高了定位和识别的正确率。 【关键字】:人脸识别;光线补偿;高斯平滑;对比度增强 一课题的来源 随着安全入口控制和金融贸易方面应用需要的快速增长,生物统计识别技术得到了新的重视。目前,微电子和视觉系统方面取得的新进展,使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度。而人脸识别是所有的生物识别方法中应用最广泛的技术之一,人脸识别技术是一项近年来兴起的,但不大为人所知的新技术。人们更多的是在电影中看到这种技术的神奇应用:警察将偷拍到的嫌疑犯的脸部照片,输入到电脑中,与警方数据库中的资料进行比对,并找出该嫌犯的详细资料和犯罪记录。这并非虚构的情节。在国外,人脸识别技术早已被大量使用在国家重要部门以及军警等安防部门。在国内,对于人脸识别技术的研究始于上世纪90年代,目前主要应用在公安、金融、网络安全、物业管理以及考勤等领域。 二人脸识别技术的研究意义 1、富有挑战性的课题 人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。人脸识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是FRT在实用应用中仍面临着很严峻的

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

人脸识别技术的几个主要研究方向

人脸识别技术的几个主要研究方向 1 引言 计算机人脸识别是指基于已知的人脸样本库,利用计算机分析图像和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还可进一步抽取出更多的生物特征(如:种族、性别、年龄..) 。计算机人脸识别是目前一个非常活跃的研究课题,它可以广泛应用于保安系统、罪犯识别以及身份证明等重要场合。虽然人类对于人脸的识别能力很强,能够记住并辨识上千个不同的人脸,可是对于计算机则困难多了,其表现在:人脸表情丰富;人脸随年龄的增长而变化;发型、胡须、眼镜等装饰对人脸造成的影响;人脸所成图像受光照、成像角度以及成像距离等影响。 计算机人脸识别技术是近20年发展起来的,90年代更成为科研热点,仅从1990 年到1999年之间,EI 可检索到的相关文献多达数千篇,关于人脸识别的综述也屡屡可见[1] 。自动人脸识别系统包括两个主要技术环节首先是人脸检测和定位,然后是对人脸进行特征提取和识别(匹配)。本文着重介绍人脸识别技术的各类方法,通过对比指出各类方法的优缺点及今后的发展方向。 2 人脸检测和定位 人脸检测和定位即对于给定的一幅图像检测图像中是否有人脸,若有则确定其在图像中的位置,并从背景中分割出来。这是个极富挑战性的问题,因为人脸是非刚体,且人脸在图像中的大小和方向以及人的肤色和纹理等方面有很大的可变形。人脸检测问题主要有四种:(1)对于给定的一幅人脸图像,将其中的人脸定位并给出其位置;(2)在一幅混乱的单色场景图中检测出所有的人脸;(3)在彩色图像中检测(定位)所有人脸;(4)在某一视频序列中,检测和定位出所有人脸。文献[2]对人脸检测进行了较为详细的综述,指出常用的人脸检测方法有四种:(1)基于知识的方法;(2)基于人脸固定特征的方法;(3)基于模板匹配的方法;(4)基于外貌的方法(Appearance-based methods),在基于模板匹配的方法中所采用的是预先确定的模板,而在基于外貌的方法中其模板的选择是通过对一系列图像的学习而确定的。一般来说,基于外貌的方法依靠统计和学习技术来找出人脸和非人脸图像的相关特征。在该方法中有特征脸法、基于聚类的方法、神经网络方法和支持向量机的方法。CMU库是常用的人脸检测库,主要的算法评定指标为错误接受率(FAR)和错误拒绝率(ARR)。 3 人脸特征提取和识别 目前大部分研究主要是针对二维正面人脸图像,也有基于三维人脸模型的方法,还有一种所谓的混合系统的身份鉴定系统。 3.1 二维正面人脸识别 在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大

人脸识别技术是什么原理

人脸识别技术是什么原理 1面像识别原理 2、1、1面像识别技术概述 面像识别是近年来随着计算机技术、图象处理技术、模式识别技术等技术的快速进步而出现的一种崭新的生物特征识别技术。生物识别技术是依靠人体的身体特征来进行身份验证的一种高科技识别技术,如同人的指纹、掌纹、眼虹膜、DNA 以及相貌等人体特征具有人体所固有的不可复制的唯一性、稳定性、无法复制一样,不易失窃或被遗忘。由于每个人的这些特征都不相同,因此利用人体的这些独特的生理特征可以准确地识别每个人的身份。 随着计算机技术的迅速发展,人们开发了指纹识别、声音识别、掌形识别、签名识别、眼纹(视网膜)识别等多种生物识别技术,目前许多技术都己经成熟并得以应用。而面像识别技术则是生物识别技术的新秀,与其他识别技术相比较,面像识别具有简便、准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、监控、出入口控制等多个方面。 面像识别技术包含面像检测、面像跟踪与面像比对等课题。面像检测是指在动态的场景与复杂的背景中判断是否存在面像并分离出面像,面像跟踪指对被检测到的面像进行动态目标跟踪,面像比对则是对被检测到的面像进行身份确认或在面像库中进行目标搜索。 面像检测分为参考模板、人脸规则、样本学习、肤色模型与特征子脸等方法。参考模板方法首先设计一个或数个标准人脸模板,然后计算测试样本与标准模板之间的匹配程度,通过阀值来判断是否存在人脸;人脸具有一定的结构分布特征,人脸规则即提取这些特征生成相应的规则以判断测试样本是否包含人脸;样本学习则采用模式识别中人工神经网络方法,通过对面像样本集和非面像样本集的学习产生分类器;肤色模型依据面像肤色在色彩空间中分布相对集中的规律来进行检测;特征子脸将所有面像集合视为一个面像子空间,基于检测样本与其在子空间的投影之间的距离判断是否存在面像。 上述方法在实际系统中也可综合采用。 面像跟踪一般采用基于模型的方法或基于运动与模型相结合的方法,另外,肤色模型跟 踪也不失为一种简单有效的手段。 面像比对从本质上讲是采样面像与库存面像的依次比对并找出最佳匹配对象。因此, 面像的描述决定了面像识别的具体方法与性能。目前主要有特征向量与面纹模板两种描述方 法,特征向量法先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离、角度等等 属性,然后计算出它们的几何特征量,这些特征量形成一描述该面像的特征向量;面纹模板 法则在库中存储若干标准面像模板或面像器官模板,在比对时,采样面像所有象素与库中所

人脸识别主要算法原理doc资料

人脸识别主要算法原 理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但

Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。 可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识

相关主题
文本预览
相关文档 最新文档