当前位置：文档之家› 语音信号的数字水印技术

语音信号的数字水印技术

DONGFANG COLLEGE，FUJIAN AGRICULTURE AND FORESTRY UNIVERSITY

课程名称：语音信号的数字水印技术

系别：计算机系

年级专业：10级电子信息工程二班

学号：1050302098

姓名：曾喜德

任课教师：罗志聪成绩：

2013 年月日

一. 作品简介 (3)

二. 设计思想 (3)

三. 设计技术和方法 (5)

四. 课程设计总结 (9)

五. 设计体会和感想 (9)

六. 参考文献 (10)

一、作品简介

随着因特网在各个应用领域的蔓延，多媒体数字作品（图像、视频、音频等）纷纷以网络形式发表，这些作品的版权保护就成为一个迫切而又比较困难的问题。现在的版权保护系统可以采用密码认证技术，但是传统的加密方式对多媒体信息的保护有一定的局限性，不能够完全保证信息的安全性。一旦密码被破解，多媒体信息就可以被任意复制、篡改，并且在法庭上很难取证。数字水印（digital watermarking)是解决这一问题的有效办法。

在保密数据传递等应用中，有时采用将一句话或一段文字或一段音乐蕴藏在另一段音乐中，然后利用专门的算法来提取所传的信息，这种方法也称为数字水印技术。这种方法的好处是信息隐藏在极为平常的声音或其它媒介中，不易被察觉。

数字水印技术可以做为加密技术的补充，增强对多媒体信息的版权保护。为有效保护知识产权，人们发明了一种将公司标识、特定数字等放人多媒体信息中的方法，以此来标识公司信息或者媒体所有权等信息，这一技术就是信息隐藏技术中的一个分支——数字水印技术（但对于数字水印系统来说，隐藏信息的丢失，意味着版权信息的丢失，从而失去了版权保护的功能，因此，这样的系统是失败的）。

此次的课程设计利用一种基于LSB的数字图像水印算法，最后利用MATLAB 对这一算法进行了实现。

1、对水印图像进行编码置乱（可采用伪随机码，提高水印图像的隐蔽性）；

2、对图像进行子图像分解（如8*8），对子块分别进行DCT变换；

对DCT系数按照zig-zag排序进行排列，选择一中频系数，对该中频系数相邻的系数进行水印嵌入

二、设计思想

数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中，但不影响原内容的价值和使用，并且不能被人的感知系统觉察和注意到。与传统的加密技术不同，数字水印技术并不能阻止盗版活动的发生，但可以判别对象是否受到保护，监视被保护数据的传播，鉴别真伪，解决版权纠纷并为法庭提供证据。

数字水印嵌入过程中，通过密钥可以提高数字水印的隐蔽性、抗攻击性，并非必须的输入。根据不同的用途，嵌入的水印有些是需要还原的，而有些则需要验证水印的存在性，前者需要数字水印的提取算法，而后者需要数字水印的检测算法，根据具体的水印算法，嵌入或提取的过程可能有所不同。

数字水印技术可以从不同的角度进行分类，因此有多种分类方法。此次的课程设计选用的是LSB法。

LSB算法是典型的空间域数据隐藏方法。LF。turner与R.GvanSchyndel等先后利用此方法将特定的标记隐藏于数字音频和数字图像内。这样，把整个图像分解为8个位平面，从LSB（最低有效位0）到MSB（最高有效为7）。从位平面分布来看，随着位平面从低位到高位，位平面的图像特征逐渐变得复杂，细节不断的增加。由于低位所代表的能量很少，改变低位对图像的质量没有太大影响。LSB方法正是利用这一点在图像低位隐藏水印信息。

首先，需要考虑嵌入的数字水印的数据量，如果嵌入最低的1位，则可以嵌入的信息量是原始图像信息量的1／8，如果适用最低两位则可以嵌入的信息量是1／4，以此类推。适用的最低位越多，嵌入的数字水印的信息量越大，同时对图像的视觉效果影响也越大。然后，适当调整数字水印图像的大小和比特位数，以适应数字水印图像数据量的要求。最后，对原始音频中要使用的最低位置0，再将数字水印数据放人原始音频的最低位即可。

三、设计技术和方法

（写出设计过程的关键代码和实验结果，并对每一步实验结果进行分析和评价）

5 GUI

四、课程设计总结

LSB算法可以用来实现音频数字水印的嵌入，将水印信息嵌入至载体信息中，并可以利用相关算法将其提取出来。

数字水印（Digital Watermarking）技术是将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中，但不影响原载体的使用价值，也不容易被人的知觉系统(如视觉或听觉系统)觉察或注意到。

通过这些隐藏在载体中的信息，可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是信息隐藏技术的一个重要研究方向。

相对来说，LSB的脆弱性使得这种算法经不起对媒体的处理，对媒体进行裁剪，缩放，旋转，压缩的变换后水印信息受到较大损坏。这是它的最大缺点。

目前，水印技术还是处在发展阶段，没有统一的国际标准，缺乏完善的软件系统，但数字水印技术作为信息加密的分支，在知识产权保护方面有着广泛的前景的应用前景。LSB数字水印算法作为最早提出的水印算法，特点是原理简单，容易实现，掌握这种算法对于以后深入研究学习数字水印技术有很大帮助。

五、设计体会和感想

课程设计的过程中遇到了很多困难，尤其是对已经学过的数字信号处理内容的生疏，以及经验的不足。

我觉得matlab确实是相当重要的一个软件，从最初学习信号与系统的时候，知道过入门的一些知识，但是我们关于matlab的操作始终都是一知半解，而在课程设计的过程中，学习使用matlab也成为难点之一。对matlab语法的系统学习，对GUI界面设计的学习，对于我来说受益颇丰

总结上面的一些体会，我觉得这个学期我们做了很多的课程设计，不管是在动手能力上，还是在促进理解原本的理论知识上都有很大的意义。在2周的设计过程中，我发现了许多的问题，有设计是出现的许多问题喝自己平时的问题，再设计的过程中有许多我们平时都不太重视的东西，也有很多的难题，再这2周里

我们每个人都是互相询问和帮助，这给了我很大的动力，有的不懂我们就会再一起讨论问题，在这2周的实习过程我知道再以后的社会里会有更加难的事等着我们的。

六、参考文献

1 信号与系统 .哈尔滨工业大学出版社.赵淑清，李绍斌

2 信号与系统——matlab综合实验 .高等教育出版社.谷源涛，郑君里

3 葛哲学.精通matlab.电子工业出版社，2008.2.1

4 数字信号处理基础董绍平，陈世耕，王洋哈尔滨工业大学出版社

5 王炳锡.数字水印技术[M].西安:西安电子科技大学出版社,2003

浅谈数字水印技术

浅谈数字水印技术近几年，许多研究人员放弃了传统密码学的技术路线，尝试用各种信号处理方法对声像数据进行隐藏加密，并将该技术用于制作多媒体的“数字水印”。数字水印技术是将一些标识信息即数字水印直接嵌入数字载体包括多媒体、文档、软件等当中，但不影响原载体的使用价值，也不容易被人的知觉系统如视觉或听觉系统觉察或注意到。人们通过隐藏在多媒体内容中的信息，能够了解到内容的原创者、内容的购买者、是否为正版、是否完整。一般数字水印系统的通用模型包括嵌入和检测（提取）两个阶段。数字水印的嵌入阶段，嵌入算法的嵌入目标是使数字水印在不可见性和鲁棒性之间找到一个较好的折衷点。检测（提取）阶段主要是设计一个相应于嵌入过程的检测（提取）算法。检测算法一般是以基于统计原理的检验结果来判断水印存在与否，它的目标是使错判与漏判的概率尽量小。提取算法通过提取出水印（如字符串或图标等）并与原始水印进行比较以判断水印是否存在。并且，为了给攻击者增加去除水印的难度，目前大多数水印制作方案都在嵌入、检测（提取）时采用了密钥，只有掌握密钥的人才能读出水印。（1）水印嵌入系统其功能是把水印信息嵌入到原始图像中，为了能成功地提取水印信号，算法必须使水印对故意或非故意的袭击和失真（相当于信道噪声）具有鲁棒性。（2）水印的恢复系统其功能是完成从待检测图像中提取出水印信号。图2 描述了一般的水印恢复过程，其中置信度表明了所考察图像I′ 存在水印的可能性。

图2 数字水印恢复方案 1 数字水印的特点数字水印应具有以下基本特征：（1）隐蔽性。指水印不可被察觉，不影响媒体产品的使用。（2）鲁棒性。指嵌入水印的图像在经受一定程度的各种有意或无意的图像处理攻击，水印仍能被检测出来。在某种程度上鲁棒性可以反映水印技术的抗干扰能力。（3）安全性。数字水印技术应该使用一个或多个密钥来确保自身的安全，未经授权，用户不能检测出隐藏在原始数据中的水印信息。（4）水印容量：是指载体在不发生形变的前提下可嵌入的水印信息量。嵌入的水印信息必须足以表示多媒体内容的创建者或所有者的标志信息，或购买者的序列号，这样有利于解决版权纠纷，保护数字产权合法拥有者的利益。尤其是隐蔽通信领域的特殊性，对水印的容量需求很大。 2 数字水印的应用数字水印技术作为数字产品的保护技术，主要应用在这几个方面：（1）版权保护版权保护：指的是多媒体数据产品的拥有者在公开发表自己的数据产品之前将会对数据产品嵌入隐秘的数字水印。在该多媒体数据产品遇到版权纠纷问题的时候，多媒体数据产品的拥有者就可以使用水印检测算法检测水印，以证明自己的版权归属。数字作品的版权保护是当前的热点问题，由于数字作品的拷贝、修改非常容易，因此原创者不得不加上损害作品的版权标志。数字水印利用其不可感知性，既保证了质量，又保护了数字作品。（2）数字指纹多媒体数据产品的拥有者可以在其产品拷贝中嵌入数字指纹，这样可以

基于Matlab的语音信号的特征提取与分类

基于Matlab的语音信号的特征提取与分类语音信号处理是研究数字信号处理技术和语音学知识对语音信号进行处理的新兴学科，是目前发展最为迅速的信息科学研究领域的核心技术之一。本文采用Matlab7.0综合运用GUI界面设计，各种函数调用等对语音信号进行采集、提取、变频、变幅，傅里叶变换、滤波等简单处理。程序界面简练，操作简便，具有一定的实际应用意义。关键词：语音信号Matlab 信号处理GUI 1、语音信号的低通滤波本文中设计了一个截止频率为200Hz切比雪夫—Ⅰ型低通滤波器，它的性能指标为：wp=0.075pi, ws=0.125pi, Rp=0.25;Rs=50dB。低通滤波器处理程序如下： [x,fs,bits]=wavread('voice.wav'); wp=0.075;ws=0.125;Rp=0.25;Rs=50; [N,Wn]=cheb1ord(wp,ws,Rp,Rs); [b,a]=cheby1(N,Rp,Wn); [b,a]=cheby1(N,Rp,Wn); X=fft(x); subplot(221);plot(x);title('滤波前信号的波形'); subplot(222);plot(X);title('滤波前信号的频谱'); y=filter(b,a,x); %IIR低通滤波 sound(y,fs,bits);%听取滤波后的语音信号

wavwrite(y,fs,bits,’低通’);%将滤波后的信号保存为“低通.wav” Y=fft(y); subplot(223);plot(y);title(' IIR滤波后信号的波形'); subplot(224);plot(Y);title(' IIR滤波后信号的频谱'); 经过低通滤波器处理后，比较滤波前后的波形图的变化低通滤波后，听到声音稍微有些发闷，低沉，原因是高频分量被低通滤波器衰减。但是很接近原来的声音。 2、语音信号的高通滤波运用切比雪夫—Ⅱ型数字高通滤波器，对语音信号进行滤波处理。高通滤波器性能指标：wp=0.6, ws=0.975 ,Rp=0.25;Rs=50dB。高通滤波器处理程序如下： [x,fs,bits]=wavread('voice.wav'); wp=0.6;ws=0.975;Rp=0.25;Rs=50;

语音信号处理答案

二、问答题（每题分，共分）、语音信号处理主要研究哪几方面的内容？语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科，语音信号处理的理论和研究包括紧密结合的两个方面：一方面，从语言的产生和感知来对其进行研究，这一研究与语言、语言学、认知科学、心理、生理等学科密不可分；另一方面，是将语音作为一种信号来进行处理，包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法和技术。、语音识别的研究目标和计算机自动语音识别的任务是什么？语音识别技术，也被称为自动语音识别，()，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。、语音合成模型关键技术有哪些？语音合成是实现人机语音通信，建立一个有听和讲能力的口语系统所需的两项关键技术，该系统主要由三部分组成：文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征，.寻求什么样的网络特征以综合声道的频率响应，.输出合成声音的质量如何保证。、语音压缩技术有哪些国际标准？二、名词解释（每题分，共分）端点检测：就从包含语音的一段信号中，准确的确定语音的起始点和终止点，区分语音信号和非语音信号。共振峰：当准周期脉冲激励进入声道时会引起共振特性，产生一组共振频率，称为共振峰频率或简称共振峰。语谱图：是一种三维频谱，它是表示语音频谱随时间变化的图形，其纵轴为频率，横轴为时间，任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。码本设计：就是从大量信号样本中训练出好的码本，从实际效果出发寻找好的失真测度定义公示，用最少的搜素和计算失真的运算量。语音增强：语音质量的改善和提高，目的去掉语音信号中的噪声和干扰，改善它的质量三、简答题（每题分，共分）、简述如何利用听觉掩蔽效应。一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值，或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明，—绝对闻阈值最小，即人耳对它的微弱声音最敏感；而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著，即在这个范围内语言可储度最高。在掩蔽情况下，提高被掩蔽弱音的强度，使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限)，被掩蔽弱音必须提高的分贝值称为掩蔽量(或称阈移)。、简述时间窗长与频率分辨率的关系。采样周期、窗口长度和频率分辨率△之间存在下列关系：△(*) 可见，采样周期一定时，△随窗口宽度的增加而减少，即频率分辨率相应得到提高，但同时时间分辨率降低；如果窗口取短，频率分辨率下降，而时间分辨率提高，因而二者是矛盾的。、简述时域分析的技术（最少三项）及其在基因检测中的应用。（）

基于小波分析的音频数字水印技术研究

广东工业大学硕士学位论文基于小波分析的音频数字水印技术研究姓名：温洁嫦申请学位级别：硕士专业：软件工程指导教师：凌捷;李伯基 20050501

摘要随着多媒体技术及网络技术的飞速发展，人们对数字产品的获取极为迅捷方便，但是这些数字产品的原创者的版权与经济利益如何得到保障？数字产品是否安全、可信？围绕这一问题，近几年国际上提出了一种新的有效的数字产品版权保护和安全性维护的新技术——数字水印（Ｄｉｇｉｔａｌｗａｔｅｒｍａｒｋ）技术。在数字产品中，音频数据产品的版权保护也显得越来越重要，因为随着数字化音像制品和音乐制品的大量制作与发行，一个令人关注的突出问题是网上下载音乐对传统ｃＤ业的邑大冲击。音频数字水印技术是一种在开放的网络环境下保护版权和认证来源及完整性的新技术，通过在合法产品中嵌入水印，以达到阻止在非法装置上播放及控制复制的目的。本文首先回顾了数字水印技术的发展历史，介绍了数字水印的一些基本问题，归纳了数字水印系统的基本框架。然后重点分析了音频数字水印技术，按照“经典的音频数字水印技术”、“变换域的音频数字水印技术”和“压缩域的音频数字水印技术”这三大类进行了分析、对比和总结。随后，介绍了小波变换思想，总结了小波变换域的音频数字水印方案，并提出了一种改进的基于小波变换的音频数字水印算法，该算法具有良好的鲁棒性，并且嵌入水印后的音频信号没有引起人耳所感知到的品质变化。算法能抵抗常见的信号处理和音频压缩编码。沧文最后讨论了音频数字水印技术进一步的研究方向。关键词：音频数字水印；小波变换；低频系数

ＡＢＳＴＲＡＣＴＤｉｇｉｔａｌｐｒｏｄｕｃｔｓａｒｃｏｂｔａｉｎｅｄｍｏｒｅａｎｄｍｏｒｅｅａｓｉｌｙａｎｄｃｏｎＶｅｎｉｅｎｔｌｙｗｉｍｔｈｅｒ印ｉｄｐｒｏｇｒｅｓｓｏｆｉｍｅｍｅｔ趾ｄｍｕｌｔｉｍｅｄｉａｔｅｃｌｌｎ０１０９ｙｌＷｈｅｒｃａＳｈｏｗｔｏｐｒｏｔｅｃｔ山ｅｃｏｐｙｒｉｇｈｔａｎｄｅｃｏｎｏｍｉｃｂｅｎｅｍｏｆⅡ１ｅａｕｔｌｌｏｒｓｈｉｐｏｆｄｉｇｉｔａｌｐｒｏｄｕｃｔｓａｎｄｗｈｅｔｈｅｒｔｈｅｐｒｏｄｕｃｔｓｓｅｃｌｌｒｅｏｒｃｒｅｄｉｂｌｅ？Ｉｎｒｅｃｅｎｔｙｅａｒｓ，ａｎｅｗｔｅｃｈｎｏｌｏｇｙｎａｍｅｄｄｉｇｉｔａｌｗａｔｅｒｍａｒｋｉｎｇｉｓｐｒｃｓｅＤｔｅｄｔｏｐｒｏｔｅｃｔ也ｅｃｏｐｙｒｉｇｈｔａｎｄｓａｆｅｔｙｏｆｄｉｇｉｔａｌｐｒｏｄｕｃｔｓ．Ｐｒｏｔｅｃｔｉｎｇｏｆｄｉｇｉｔａｌａｕｄｉｏｐｍｄｕｃｔｓｈａｓｂｅｅｎｍｏｒｅａｎｄｍｏｒｅｉｍｐｏｒｔａｎｔ．Ｗｉｎｌｔｒａｎｓｍｉｓｓｉｏｎｏｆｄ噜ｉｔａｌａｕｄｉｏｐｒｏｄｕｃｔｓ，ａｎｏｕｔｓｔａｎｄｉｎｇｐｒｏｂｌｅｍｉｓｔｈｅｉ加ｐｉｎｇｅｍｅｎｔｏｆｍｕｓｉｃｄｏｗｎｌｏａｄｅｄｆｒｏｍｎｅｔＷｏｒｋｏｎ仃ａｄｉｔｉｏｎａ】Ｃｏ瑚ｐａｃｔＤｉｓｃｉｎｄｕｓｎｙＡｕｄｉｏｄｉｇｉｔａｌｗａｔｅ丌ｎａｒｋｉｎｇｉｓａｎｅｗｔｅｃｈｎｏｌｏｇｙｔｏｐｍｔｅｃｔｃｏｐｙｒｉｇｈｔａｎｄａｃｃｏＩｎｐｌｉｓｈａｕｔｈｅｎｔｉｃａｔｉｏｎａｎｄｉｎｔｅ掣崎ｉｎ叩ｅｎｎｅ觚ｏｒｋｓ．Ｉ且ｍｉｓｔｈｅｓｉｓ，ｎｒｓｔｌｙｗｅｒｅＶｉｅｗｔｈｅｄｅｖｅｌｏｐｍｅｎｔｈｉｓｔｏｒｙｏｆｄ远ｉｔａｌｗａｔｅｎｎａｒｋ，ｉｎｔｒｏｄｌｌｃｅｓｏｍｅｂａｓｉｃｉｓｓｕｅｓａｎｄｃｏｎｃｌｕｄｅｍｅ疗锄ｅｗｏｒｋｏｆｅｍｂｅｄｄｉｎｇａｎｄｄｅｔｅｃｔｉｏｎｓｙｓｔｅｍ．Ｔｈｅｎ，ｉｎＣｈａｐｔｅｒ３，ｗｅｅｍｐｈａｓｉｚｅｏｎａｎａｌｙｚｉｎｇａｕｄｉｏｄｉ垂协１ｗａｔｅｒｒｎａｒｋｉｎｇ．Ｃｌａｓｓｉｃａｌａｕｄｉｏｄｉｇｉｔａｌｗａｔｅ瑚ａｒｋ，ａｕｄｉｏｄｉｇｉｔａｌｗａｔｅｎｎａｒｋｂａｓｅｄｏⅡｔｒａｎｓｆｏｎｌｌｄｏｍａｉｎａｎｄｃｏｍｐｒｅｓｓｉｏｎｄｏｍａｉｎａｒｅａｎａｌｙｚｅｄ，ｃｏｍｐａｒｅｄａｎｄｓｍｎ眦ｒｉｚｅｄ．ｗａｖｅｌｅｔ咖ｓｆｏ咖ｉｓｉｎ打ｏｄｕｃｅｄ，ａｎｄｍｅＮｅｘｔ，ｉｎＣｈａｐｔｅｒ４，ｔｈｅｉｄｅａｏｆｗａｖｅｌｅｔ－ｂａｓｅｄａｕｄｉｏｄｉ西ｔａｌｗａｔｅｒｍａｒ咖ｇｓｃｈｅｍｅｓａｒｅｓｍｎｍａｒｉｚｅｄ，ａｎｄｔｈｅｎａｎｗａｖｅｌｅｔ姐ｎｓｆ０Ｈｎｉｓｉｍｐｒｏｖｅｄａｕｄｉｏｄｉｇｉｔａｌｗａｔｅｒｍａｒｋｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｐｒｅｓｅｎｔｅｄ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｉｎｄｉｃａｔｅ廿ｌａｔ出ｅａｋ喊ｔｈｍｈａｓｇｏｏｄｉｎＶｉｓｉｂｍｔｙａｎｄｒｏｂｕｓｍｅｓｓａｎｄｃａｎｒｅｓｉｓｔｆｈＩｎｉｌｉａｒｓｉ萨ａ１ｐｒｏｃｅｓｓｉｎｇａＤｄａｕｄｉｏ舶ｑｕｅｎｃｙｃｏｍｐｒｅｓｓｉｏｎｅｎｃｏｄｉｎｇＦｉｎａｌ】ｙｆｕｔｕｒｅｄｉｒｅｃｔｉｏｎｓｆｏｒｍｅｓｔｕｄｙａｒｅｄｉｓｃｕｓｓｅｄ．ＫＥＹｗｏＲＤＳ：Ａｕｄｉｏｄｉｇｉｔａｌｗａｔｅｍａｒ岫ｎｇ；Ｗａｖｅｌｅｔ廿ａｎｓｆｏｒｍ；Ｃｏｅ硒ｃｉｅｎｔｓｏｆｌｏｗ缸＿ｃｑｕｅｎｃｙ

数字水印技术：概念、应用及现状

数字水印技术：概念、应用及现状一、引言随着信息时代的到来，特别是Internet的普及，信息的安全保护问题日益突出。当前的信息安全技术基本上都以密码学理论为基础，无论采用传统的密钥系统还是公钥系统，其保护方式都是控制文件的存取，即将文件加密成密文，使非法用户不能解读。但随着计算机处理能力的快速提高，这种通过不断增加密钥长度来提高系统秘密级别的方法变得越来越不安全。另一方面，多媒体技术已被广泛应用，需要进行加密、认证和版权保护的声像数据也越来越多。数字化的声像数据从本质上说就是数字信号，如果对这类数据也采用密码加密方式，则其本身的信号属性就被忽略了。最近几年，许多研究人员放弃了传统密码学的技术路线，尝试用各种信号处理方法对声像数据进行隐藏加密，并将该技术用于制作多媒体的“数字水印”。二、认识数字水印数字水印（Digital Watermark）技术是指用信号处理的方法在数字化的多媒体数据中嵌入隐蔽的标记，这种标记通常是不可见的，只有通过专用的检测器或阅读器才能提取。数字水印是信息隐藏技术的一个重要研究方向。数字水印技术的基本特性: 1. 鲁棒性(robustness)：所谓鲁棒性是指在经历多种无意或有意的信号处理过程后，数字水印仍能保持完整性或仍能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。 2.安全性(security):指隐藏算法有较强的抗攻击能力，即它必须能够承受一定程度的人为攻击，而使隐藏信息不会被破坏。 3.透明性(invisibility):利用人类视觉系统或人类听觉系统属性，经过一系列隐藏处理，使目标数据没有明显的降质现象，而隐藏的数据却无法人为地看见或听见。 ***典型的数字水印系统模型：图 1为水印信号嵌入模型，其功能是完成将水印信号加入原始数据中；图 2为水印信号检测模型，用以判断某一数据中是否含有指定的水印信号。

语音信号数字水印技术

数字信号处理课程设计报告题目：语音信号水印技术系统设计系（院）: 专业：班级：学号：姓名：指导教师：学年学期: 2013 ~ 2014 学年第学期 2013年月日

摘要随着网络和信息技术的发展，越来越多的数字多媒体信息通过网络进行传播，与传统的模拟媒体相比，数字媒体产品的编辑、复制和传播都很方便，它一方面促进了社会的进步与发展，另一方面正是这些优点突出了版权问题。由于数字多媒体信息很容易被未经授权的用户复制，且采用传统密码方法加密，不能完全解决盗版问题。数字水印技术正是应运而生的信息隐藏技术，它通过特定的水印算法把版权信息嵌入在数字产品中，被嵌入的可以是一段文字、标识、序列号等等，人们无法从表面上感知水印的存在，只有专用的检测仪器或计算机软件才可以检测出隐藏的数字水印，从而达到了保护数字作品的所有者利益的目的，并促进了数字产品的开发与使用。在数字产品中，音频数据产品的版权保护也显得越来越重要，因为随着数字化音像制品和音乐制品的大量制作与发行，一个令人关注的突出问题是网上下载音乐对传统CD 业的巨大冲击。音频水印技术主要利用了人类听觉模型，在不影响音频信号质量的前提下，将水印信息隐藏在人耳不能感知的位置，来隐藏水印数据。本文主要研究语音信号水印技术，利用小波变换的优点和特性对音频信号嵌入水印，并提取。使嵌入水印音频想好具有良好的安全性，鲁棒性和不可感知性。关键词数字水印嵌入提取小波变换

目录 1 课题综述 (1) 1.1 数字水印技术的介绍 (1) 1.2 数字水印设计原理 (2) 2 系统分析与设计 (3) 2.1 涉及基础知识 (3) 2.2 算法的流程图 (5) 2.3 算法实现 (5) 3 代码编写 (7) 3.1 主要代码 (7) 3.2 程序调试 (10) 3.3 程序运行与测试 (10) 结论 (14) 致谢 (16) 参考文献 (17)

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计摘要：语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用，如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法，并在采集语音信号后，在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声，对加入噪声的信号进行频谱分析，设计合适的滤波器滤除噪声，恢复原信号。利用MATLAB来读入（采集）语音信号，将它赋值给某一向量，再将该向量看作一个普通的信号，对其进行FFT变换实现频谱分析，再依据实际情况对它进行滤波，然后我们还可以通过sound命令来对语音信号进行回放，以便在听觉上来感受声音的变化。关键词：Matlab，语音信号，傅里叶变换，滤波器 1课程设计的目的和意义本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计，拟主要达到以下几个目的： 1.1．了解Matlab软件的特点和使用方法。 1.2．掌握利用Matlab分析信号和系统的时域、频域特性的方法； 1.3．掌握数字滤波器的设计方法及应用。 1.4．了解语音信号的特性及分析方法。 1.5．通过本课题的设计，培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标设计一个简单的语音信号分析系统，实现对语音信号时域波形显示、进行频谱分析，

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序，并且利用GUI设计图形用户界面。具体任务是： 2.1．采集语音信号。 2.2．对原始语音信号加入干扰噪声，对原始语音信号及带噪语音信号进行时频域分析。 2.3．针对语音信号频谱及噪声频率，设计合适的数字滤波器滤除噪声。 2.4．对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样，回放并与原始信号进行比较。 2.6．对语音信号部分时域参数进行提取。 2.7．设计图形用户界面（包含以上功能）。 3 设计方案论证 3.1语音信号的采集使用电脑的声卡设备采集一段语音信号，并将其保存在电脑中。 3.2语音信号的处理语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等，以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析语音信号是一种非平稳的时变信号，它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法，其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说，可以很方便地确定其对正弦或复指数和的响应，所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外，傅立叶表示使信号的某些特性变得更明显，因此，它能更

音频数字水印报告+matlab程序

音频数字水印目录 1课题背景与现状 (2) 2研究的目的和意义 (4) 3方案设计和实施计划 (8) 4研究的主要内容 (10) 5创新点和结论 (10) 6成果的应用前景 (11) 7附录：个人工作总结 ................................................................................................ 错误！未定义书签。

1课题背景与现状数字时代的到来，多媒体数字世界丰富多彩，数字产品几乎影响到每一个人的日常生活。信息媒体的数字化为信息的存取提供了极大的便利，同时也显著地提高了信息表达的效率和准确度。计算机网络通信技术特别是互联网的蓬勃发展，使得数据的交换和传输变成了一个相对简单且快捷的过程。人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传达到世界各地，在国际互联网上发布自己的作品，传递重要的信息，进行各种学术交流和电子商务活动等等。如何保护这些与我们息息相关的数字产品，如版权保护、信息安全、数据认证以及访问控制等等，已受到日益重视并变得迫切需要了，因此数字水印在今天的计算机和互联网时代大有可为。数字水印技术是近十年才发展起来的，它是信息隐藏学的一个分支。随着国内信息化程度的提高和电子商务逐渐走向实用，数字水印技术将会拥有更加广阔的应用前景。鉴于信息隐藏与数字水印技术的应用前景，众多知名研究机构如麻省理工学院的多媒体实验室、剑桥大学的多媒体实验室、IBM数字实验室、日立、NEC、SONY，PHILIPS、微软等都加入到信息隐藏和数字水印技术的研究和应用并取得了一定的成果。1996年5月，第一届国际信息隐藏学术研讨会(CIHW)在英国剑桥牛顿研究所召开，至今该研讨会已举办了四届。另外，在IEEE

数字水印技术英文材料

A.Lumini,D.Maio.A wavelet-based image watermarking scheme,Proc of Int Conf.On Information Technology:Coding and Computing,2000:122-127. 与Fourier变换相比，小波变换是空间(时间)和频率的局部变换，因而能有效地从信号中提取信息。通过伸缩和平移等运算功能可对函数或信号进行多尺度的细化分析，解决了Fourier变换不能解决的许多困难问题。小波变换联系了应用数学、物理学、计算机科学、信号与信息处理、图像处理、地震勘探等多个学科。数学家认为，小波分析是一个新的数学分支，它是泛函分析、Fourier分析、样调分析、数值分析的完美结晶；信号和信息处理专家认为，小波分析是时间—尺度分析和多分辨分析的一种新技术，它在信号分析、语音合成、图像识别、计算机视觉、数据压缩、地震勘探、大气与海洋波分析等方面的研究都取得了有科学意义和应用价值的成果。小波(Wavelet)这一术语，顾名思义，“小波”就是小的波形。所谓“小”是指它具有衰减性；而称之为“波”则是指它的波动性，其振幅正负相间的震荡形式。与Fourier变换相比，小波变换是时间(空间)频率的局部化分析，它通过伸缩平移运算对信号(函数)逐步进行多尺度细化，最终达到高频处时间细分，低频处频率细分，能自动适应时频信号分析的要求，从而可聚焦到信号的任意细节，解决了Fourier变换的困难问题，成为继Fourier变换以来在科学方法上的重大突破。有人把小波变换称为“数学显微镜”。 [C]小波分析的应用是与小波分析的理论研究紧密地结合在一起的。现在，它已经在科技信息产业领域取得了令人瞩目的成就。电子信息技术是六大高新技术中重要的一个领域，它的重要方面是图象和信号处理。现今，信号处理已经成为当代科学技术工作的重要部分，信号处理的目的就是：准确的分析、诊断、编码压缩和量化、快速传递或存储、精确地重构(或恢复)。从数学地角度来看，信号与图象处理可以统一看作是信号处理(图象可以看作是二维信号)，在小波分析地许多分析的许多应用中，都可以归结为信号处理问题。现在，对于其性质随实践是稳定不变的信号，处理的理想工具仍然是傅立叶分析。但是在实际应用中的绝大多数信号是非稳定的，而特别适用于非稳定信号的工具就是小波分析。事实上小波分析的应用领域十分广泛，它包括：数学领域的许多学科；信号分析、图象处理；量子力学、理论物理；军事电子对抗与武器的智能化；计算机分类与识别；音乐与语言的人工合成；医学成像与诊断；地震勘探数据处理；大型机械的故障诊断等方面；例如，在数学方面，它已用于数值分析、构造快速数值方法、曲线曲面构造、微分方程求解、控制论等。在信号分析方面的滤波、去噪声、压缩、传递等。在图象处理方面的图象压缩、分类、识别与诊断，去污等。在医学成像方面的减少B超、CT、核磁共振成像的时间，提高分辨率等。 (1)小波分析用于信号与图象压缩是小波分析应用的一个重要方面。它的特点是压缩比高，压缩速度快，压缩后能保持信号与图象的特征不变，且在传递中可以抗干扰。基于小波分析的压缩方法很多，比较成功的有小波包最好基方法，小波域纹理模型方法，小波变换零树压缩，小波变换向量压缩等。 (2)小波在信号分析中的应用也十分广泛。它可以用于边界的处理与滤波、时频

语音信号特征的提取

语音信号特征的提取摘要随着计算机技术的发展，语音交互已经成为人机交互的必要手段,语音特征参数的精确度直接影响着语音合成的音质和语音识别的准确率。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。本文采用Matlab软件提取语音信号特征参数，首先对语音信号进行数字化处理，其次，进行预处理，包括预加重、加窗和分帧，本文讨论了预处理中各种参数的选择，以使信号特征提取更加准确。第三，讨论了各种时域特征参数的算法，包括短时能量、短时过零率等。关键词：语音信号, 特征参数, 提取, Matlab 目录第一章绪论 1.1语音信号特征提取概况 1.1.1研究意义语音处理技术广泛应用于语音通信系统、声控电话交换、数据查询、计算机控制、工业控制等领域，带有语音功能的计算机也将很快成为大众化产品，语音将可能取代键盘和鼠标成为计算机的主要输入手段，为用户界面带来一次飞跃。语音信号特征的提取是语音信号处理的前提和基础，只有分析出可表示语音信号本质特征的参数，才有可能利用这些参数进行高效的语音通信和准确的语音识别，才能建立语音合成的语音库。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 1.1.2 发展现状语音信号处理是一门综合性的学科，包括计算机科学、语音学、语言学、声学和数学等诸多领域的内容。它的发展过程中，有过两次飞跃。第一次飞跃是1907年电子管的发明和1920年无线电广播的出现，电子管放大器使很微弱的声

音也可以放大和定量测量，从而使电声学和语言声学的一些研究成果扩展到通信和广播部门；第二次飞跃是在20世纪70年代初，电子计算机和数字信号处理的发展使声音信号特别是语音信号，可以通过模数转换器（A/D）采样和量化转换为数字信号，这样就可以用数字计算方法对语音信号进行处理和加工，提高了语音信号处理的准确性和高效性。语音信号处理在现代信息科学中的地位举足轻重，但它仍有些基础的理论问题和技术问题有待解决，这些难题如听觉器官的物理模型和数学表示及语音增强的技术理论等，目前还有待发展。 1.2 本课题研究内容本文主要介绍语音信号处理的理论及Matlab的相关内容，然后从Matlab仿真角度验证了录音、预处理、提取语音信号时域特征参数，主要讨论了预处理中各种参数的选择，以使信号特征提取更加准确。再次讨论了各种时域特征参数的算法，包括短时能量、短时过零率等，介绍了各环节的不同软件实现方法。最后对基于Matlab的语音信号特征参数提取进行总结。第二章Matlab简介 MATLAB是国际上仿真领域最权威、最实用的计算机工具。它是MathWork 公司于1984年推出，它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境，特别是所附带的30多种面向不同领域的工具箱支持，使得它在许多科学领域中成为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。 2.1 发展概况 Matlab是Matrix Laboratory(矩阵实验室的缩写)，最初由美国Cleve Moler 博士在70年代末讲授矩阵理论和数据分析等课程时编写的软件包Linpack与Eispack组成，旨在使应用人员免去大量经常重复的矩阵运算和基本数学运算等繁琐的编程工作。1984年成立的Math Works公司正式把Matlab推向市场，并从事Matlab的研究和开发。1990年，该公司推出了以框图为基础的控制系统仿真工具Simulink，它方便了系统的研究与开发，使控制工程师可以直接构造系统框图进行仿真，并提供了控制系统中常用的各种环节的模块库。1993年，Math Works 公司推出的Matlab4.0版在原来的基础上又作了较大改进，并推出了Windows版，

数字水印基本原理

介绍了数字水印技术的基本原理随着信息技术和计算机网络的飞速发展，人们不但可以通过互联网和CD-ROM方便快捷地获得多媒体信息，还可以得到与原始数据完全相同的复制品，由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此，数字多媒体产品的水印处理技术已经成为近年来研究的热点领域之一。虽然数字水印技术近几年得到长足发展，但方向主要集中于静止图像。由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立，视频水印技术的发展滞后于静止图像水印技术。另一方面，由于针对视频水印的特殊攻击形式的出现，为视频水印提出了一些区别于静止图像水印的独特要求。本文分析了MPEG—4视频结构的特点，提出了一种基于扩展频谱的视频数字水印改进方案，并给出了应用实例。 1视频数字水印技术简介 1.1数字水印技术介绍数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中，但不影响原内容的价值和使用，并且不能被人的感知系统觉察或

注意到。与传统的加密技术不同，数字水印技术并不能阻止盗版活动的发生，但可以判别对象是否受到保护，监视被保护数据的传播，鉴别真伪，解决版权纠纷并为法庭提供认证证据。为了给攻击者增加去除水印的难度，目前大多数水印制作方案都采用密码学中的加密体系来加强，在水印嵌入、提取时采用一种密钥，甚至几种密钥联合使用。水印嵌入和提取的一般方法如图1所示。 1.2视频数字水印设计应考虑的几个方面水印容量：嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。不可察觉性：嵌入在视频数据中的数字水印应该不可见或不可察觉。鲁棒性？押在不明显降低视频质量的条件下，水印很难除去。盲检测：水印检测时不需要原始视频，因为保存所有的原始视频几乎是不可能的。篡改提示：当多媒体内容发生改变时，通过水印提取算法，能够敏感地检测到原始数据是否被篡改。 1.3视频数字水印方案选择通过分析现有的数字视频编解码系统，可以将目前MPEG-4视频水印的

基于LSB的数字水印技术研究

第18卷第4期Vol 118 No 14北京印刷学院学报 Journal of Be iji ng Instit ute of Graphic Co mmunicati on 2010年8月Aug 12010 收稿日期:2010201212 基金项目:北京市教委面上项目(K M 201010015003) 基于LSB 的数字水印技术研究陈如琪,林国汇,郑良斌 (北京印刷学院,北京102600) 摘要:信息媒体的数字化为信息的保存和提取提供了极大的方便,特别是随着互联网技术的迅猛发展,图像、语音、文本和视频等数字形式产品的传送空间不断扩大,传送时间也在不断缩短。数字化产品在发布和传送过程中很容易被侵权、盗版或随意篡改,数字产品的信息安全成为世界各国亟待解决的问题。在分析加密技术的基础上,阐述了数字图像的水印技术,研究了空域数字图像水印技术,变换域数字图像水印技术,自适应数字图像水印技术,提出了最低有效位算法改进算法。关键词:数字水印;数字图像;嵌入算法中图分类号:TP393108 文献标识码:A 文章编号:100428626(2010)0420056205 R esearch on L S B W a term a rk T echnology CHEN R u 2q,i LIN Guo 2hu,i Z H ENG L i ang 2b i n (Beiji ng Instit u t e of Graph i c Co m m un i cati on,Beiji ng 102600,Ch i n a) Ab str act :The di g i tiza tion of i nforma ti on med i a can provi de great conven i ence for i n f or m ati on access .Especiall y ,w it h the rapid develo pment of Inte rnet ,d i gita l products s uch as i m age ,aud i o ,text and vi deo ,can be trans m itted m ore rapi d l y i n ti m e and more wide l y i n space .The i nfor m ati on secur ity proble m s urgentl y need to be solved i n t he wor l d because digital products can be easily copied ,pirated or juggled i n the trans m iss i on process .On the base of ana l yzi ng encry p tio n ,expatiate d i gita l i m age wa ter m ark i ng ,disqu i s itio n spatial do m ai n digital i m age water m ark i ng techn i que ,transfor m do m ain and au t oadapta ti on digital i m age wa ter m ark i ng techn i que ,this paper put forward t he i m proved LSB ar it hme ti c .K ey w or ds :d i gita lwater m ark ;di gita l i m age ;e mbed a rith m e 2 tic 随着互联网的逐渐普及和发展,信息媒体的数字化成为一种必然的发展趋势,越来越多的信息媒体的发布和传输都借助网络以数字的形式进行。信息媒体的数字化为信息的存取提供了极大的便利条件,同时,也提高了信息表达的效率和准确性。但是随之而来的问题是通过网络传输的数据文件,容易使得有恶意的个人在没有得到许可的情况下, 拷贝和传输有版权的数据内容,因此,如何在网络环境中,实现有效的版权保护和信息安全手段,成为亟待解决的问题。数字水印技术是一种信息安全技术,它不同于传统的信息加密技术。传统的信息加密技术是将要保护的多媒体数据文件加密成密文的形式,然后在网络上发布,使得数据传输过程中出现的非法攻击者无法从密文中得到机密信息,从而达到版权保护和信息安全的目的。但是,这种信息加密技术有一定的弊端,首先,加密后的文件由于其不可理解性而妨碍了多媒体信息在网络中的传输;其次,加密后的密文更加容易引起非法攻击者的好奇和注意,并且有被破解的可能性,一旦密文被破解,其内容就成为完全透明。数字水印技术是在数字图像、音频和视频等数字产品中嵌入秘密信息,以便保护数字产品的版权,证明数字产品的真实可靠性,跟踪盗版行为或提供产品的附加信息。秘密信息可以是版权标志,用户序列号或者是产品相关信息 [123] 。 1 数字水印技术的分类数字水印是加在数字图像、音频或视频等媒体中的信号,这个信号能够建立产品所有权,辨识提供数字产品的一些额外信息。按水印特性可将水印划分为可见水印和不可见水印。可见水印是可以看见的水印,水印在图像中可见。水印在图像中不太醒目,在保证图像质量的前提下,水印很难被去除,水印加在不同的图像中具有一致的视觉效果。不可见水印是一种应用较广泛的水印,被加在图像、音频、视频当中,表面上是不可察觉的,当发生版权纠纷时,所有者可以从中提取出来标记,从而证明该物品的所有权 [425] 。 2 数字图像的数字水印技术数字图像的数字水印技术是当前水印研究中的重点之一。对图像水印的研究可分为空域水印

语音信号处理 (第2版)赵力编著语音信号处理勾画要点

语音信号处理（第2版）赵力编著重点考点第2章语音信号处理的基础知识 1.语音（Speech）是声音（Acoustic）和语言（Language）的组合体。可以这样定义语音：语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段：（1）想说阶段（2）说出阶段（3）传送阶段（4）理解阶段（5）接收阶段。 3.语音是人的发声器官发出的一种声波，它具有一定的音色，音调，音强和音长。其中，音色也叫音质，是一种声音区别于另一种声音的基本特征。音调是指声音的高低，它取决于声波的频率。声音的强弱叫音强，它由声波的振动幅度决定。声音的长短叫音长，它取决于发音时间的长短。 4.说话时一次发出的，具有一个响亮的中心，并被明显感觉到的语音片段叫音节（Syllable）。一个音节可以由一个音素（Phoneme）构成，也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音（Vowel）和辅音（Consonant）两种音素。 5.元音的另一个重要声学特性是共振峰（Formant）。共振峰参数是区别不同元音的重要参数，它一般包括共振峰频率（Formant Frequency）的位置和频带宽度（Formant Bandwidth）。 6.区分语音是男声还是女声、是成人声音还是儿童声音，更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期（或基音频率），F0表示。 8.人的听觉系统有两个重要特性，一个是耳蜗对于声信号的时频分析特性；另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型：一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型：一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔，按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型：激励模型、声道模型和辐射模型的串联来表示。 13.语谱图：人们致力于研究语音的时频分析特性，把和时序相关的傅立叶分析的显示图形。第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码（一般就是PCM码）；预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个：

语音信号特征参数研究

语音信号特征参数研究石海燕（浙江工业大学信息工程学院，浙江杭州３１００３２）摘要：在语音技术的发展过程中使用了大量的语音信号特征参数，好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍，并介绍了语音信号的短时能量、短时平均幅度的提取。关键词：语音信号；特征参数；短时能量中图分类号：ＴＰ３９１文献标识码：Ａ文章编号：１００９－３０４４（２００８）０４－１０７５４－０４ＳｔｕｄｙｏｎＳｐｅｅｃｈＳｉｇｎａｌＦｅａｔｕｒｅＰａｒａｍｅｔｅｒＳＨＩＨａｉ－ｙａｎ（ＣｏｌｌｅｇｅｏｆＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＺｈｅｊｉａｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｈａｎｇｚｈｏｕ３１００３２，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｉｎｔｈｅｐｒｏｃｅｓｓｏｆｄｅｖｅｌｏｐｉｎｇｓｐｅｅｃｈｔｅｃｈｎｏｌｏｇｙｕｓｅｄｉｎａｌａｒｇｅｎｕｍｂｅｒｏｆｓｐｅｅｃｈｓｉｇｎａｌｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓ，ａｇｏｏｄｓｐｅｅｃｈｓｉｇｎａｌｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓｐｌａｙｅｄａｃｒｉｔｉｃａｌｒｏｌｅｉｎｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎ．Ｉｎｔｈｉｓｐａｐｅｒｗｅｉｎｔｒｏｄｕｃｅｄｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓ，ｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓｓｅｌｅｃｔｉｏｎ，ａｎｄｉｎｔｒｏｄｕｃｅｄｓｈｏｒｔ－ｔｅｒｍｅｎｅｒｇｙ、ｓｈｏｒｔ－ｔｅｒｍａｖｅｒａｇｅｒａｎｇｅｅｘｔｒａｃｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｓｐｅｅｃｈｓｉｇｎａｌ；ｆｅａｔｕｒｅｐａｒａｍｅｔｅｒ；ｓｈｏｒｔ－ｔｅｒｍｅｎｅｒｇｙ１引言在语音识别的发展过程中使用了大量的语音信号特征参数。特征参数的提取是关系到语音识别系统性能好坏的一个关键技术，其基本思想是将预处理过的信号通过一次变换，去掉冗余部分，而把代表语音本质的特征参数抽出来。接下去所要作的识别处理都是建立在特征参数之上的，如果特征参数不能很好地反映语音信号的本质，识别就不能成功。语音信号特征参数是分帧提取的，每帧特征参数一般构成一个矢量，所以语音信号特征是一个矢量序列。我们将语音信号切成一帧一帧，每帧大小大约是２０￣３０ｍｓ。帧太大就不能得到语音信号随时间变化的特性，帧太小就不能提取出语音信号的特征，每帧语音信号中包含数个语音信号的基本周期。有时希望相邻帧之间的变化不是太大，帧之间就要有重叠，帧叠往往是帧长的１／２或１／３。帧叠大，相应的计算量也大。常用的语音特征参数有平均能量、平价跨零数或跨零率、共振峰、ＬＰＣ参数、倒谱参数、临界带倒谱等。下一节介绍一些常用的语音特征。２语音信号特征参数介绍（１）基音周期（Ｐｉｔｃｈ）人的语音基本上由两类构成，一类是浊音（ｖｏｉｃｅ），另一类是清音（ｕｎｖｏｉｃｅ）。浊音的语音信号具有较强的周期性，不同的浊音波形是不同的。浊音的这种周期叫基音周期，其倒数叫做基音频率，它主要和声带的特性有关。一般来说，成年男性的语音的基音频率在６０Ｈｚ￣２００Ｈｚ，而成年女性和儿童语音的基音频率在２００Ｈｚ￣４５０Ｈｚ。清音的语音信号具有随机噪声的特点，一般来说清音的幅度小于浊音的幅度。基音周期（Ｐｉｔｃｈ）是指发浊音时声带震动所引起的周期运动时间间隔，代表声带震动的快慢，震动越快音高会越高，基音周期是声带振动频率Ｆ０的倒数，它是语音信号分析的一个重要参数。（２）短时频谱语音信号特征在较短的时间间隔中保持基本不变，即语音信号具有时变特性，因而可以将语音信号看作是一个短时平稳过程。语音信号具有一些重要的短时特征。短时频谱是语音信号的一个重要的短时特性。可以用下列公式计算：（１）收稿日期：２００８－０１－１２个人简介：石海燕（１９７７－），女，浙江诸暨人，实验师，主要研究方向：语音处理、模式识别。

文档之家