当前位置:文档之家› 语音信号的时域特征分析

语音信号的时域特征分析

语音信号的时域特征分析
语音信号的时域特征分析

中北大学

课程设计说明书

学生姓名:蒋宝哲学号: 24

学生姓名:瓮泽勇学号: 42

学生姓名:侯战祎学号: 47

学院:信息商务学院

专业:电子信息工程

题目:信息处理实践:语音信号的时域特征分析指导教师:徐美芳职称: 讲师

2013 年 6 月 28 日

中北大学

课程设计任务书

2012-2013 学年第二学期

学院:信息商务学院

专业:电子信息工程

学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 课程设计题目:信息处理实践:语音信号的时域特征分析起迄日期: 2013年6 月7日~2013年6月 28 日

课程设计地点:学院楼201实验室、510实验室、608实验室指导教师:徐美芳

系主任:王浩全

下达任务书日期: 2013 年 6 月 7 日

语音信号的采集与分析

摘要

语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。

关键词:语音信号,采集与分析, Matlab

0 引言

通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。

让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。

语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。语音信号采集与分析是以语音语言学和数字

信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。

1.语音信号的介绍

1.1 语音信号的特点

通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点:

①在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。

②在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。

下面是一段语音信号的时域波形图(图2-1)和频域图(图2-2),由这两个图可以看出语音信号的两个特点。

Frequency(Hz)

Time(s)x 104图2-1语音信号时域波形图图2-2语音信号频域波形图

Figure 2-1Speech signal time-domain waveform Figure 2-2 Frequency-domain speech signal waveform

1.2语音信号的采集

在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:①抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。②抑制

50Hz 的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH 和fL ,则对于绝人多数语音编译码器,fH=3400Hz 、fL =60~100Hz 、采样率为fs =8kHz ;而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。当使用要求较高或很高的场合时fH =4500Hz 或8000Hz 、fL =60Hz 、fs =10kHz 或20kHz 。

为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t 在模拟信号x(t)上逐点采取其瞬时值。采样时必须要注意满足奈奎斯特定理,即采样频率fs 必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。下图时一段语音信号在采样频率44.1KHz 情况下的频谱图。

1

2

3

4

5

6

x 10

4

原始信号

00.51 1.52 2.5x 10

4

由图可知,这段语音信号的频率主要集中在1KHz 左右,当采样频率为44.1KHz 时,由于采样频率比较大,所以采样点数就越密,所得离散信号就越逼近于原信号,频谱也没有发生混叠。

1

2

3

4

5

6

x 10

4

-0.2

00.20.4

0.6抽取后的信号

5000

10000

15000

11.522.5

3

对上述信号进行1/80采样频率抽取,即采样频率变为将近500Hz 时,由于采样频率比较小,所以采样点数就稀疏,所得离散信号就越偏离于原信号,频谱也发生了混叠。

在采样的过程中应注意采样间隔的选择和信号混淆:对模拟信号采样首先要确定采样间隔。如何合理选择△t 涉及到许多需要考虑的技术因素。一般而言,采样频率越高,采样点数就越密,所得离散信号就越逼近于原信号。但过高的采样频率并不可取,对固定长度(T )的信号,采集到过大的数据量(N=T/△t ),给计算机增加不必要的计算工作量和存储空间;若数据量(N )限定,则采样时间过短,会导致一些数据信息被排斥在外。采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。量化电平按级数变化,实际的振动值是连续的物理量。具体振值用舍入法归到靠近的量化电平上。

语音信号经过预滤波和采样后,由A /D 变换器变换为二址制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D 变换、量化处理的离散的数字信号。

在实际工作中,我们可以利用windows 自带的录音机录制语音文件,图2-3是基于PC

机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得W A VE文件,为后续的处理储备原材料。调节录音机保存界面的“更改”选项,可以存储各种格式的W A VE文件。

图2-3 基于PC机的语音信号采集过程

Figure 2-3 Voice PC-based signal acquisition process

采集到语音信号之后,需要对语音信号进行分析,如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。

2 语音信号的分析

2.1语音信号分析技术

语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理[8]。而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分桥的准确性和精确性。因此语音信号分析在语音信号处理应用中具有举足轻重的地位。

贯穿于语音分析全过程的是“短时分析技术”。因为,语音信号从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个非乎稳态过程,不能用处理乎稳信号的数字信号处理技术对其进行分析处理。但是,由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢的,所以从另一方面看,虽然语音倍号具有时变特性,但是在一个短时间范围内(一般认为在10~30ms的短时间内),其特性基本保持不变即相对稳定,因面可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。所以任何语音信号的分析和处理必须建立在“短时”的基础上.即进行“短时分析”,将语音信号分为一段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为10~30ms。这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。

根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒领域分析等;时域分析方法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说

频域分析更为重要。本文将简要介绍时域分析、频域分析以及语谱图分析。

2.2 语音信号的时域分析

语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是:①表示语音信号比较直观、物理意义明确。②实现起来比较简单、运算且少。③可以得到语音的一些重要的参数。④只使用示波器等通用设备,使用较为简单等。

语音信号的时域参数有短时能量、短时过零率、短时白相关函数和短时平均幅度差函数等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理技术中都要应用[6]。在计算这些参数时使用的一般是方窗或汉明窗。 2.2.1 短时能量及短时平均幅度分析

设语音波形时域信号为x(l)、加密分帧处理后得到的第n 帧语音信号为 Xn(m ),则Xn(m)满足下式:

()()()(n x m w m x n m m

=+ 01m N ≤≤- (3-1)

10~(1

(){m N m w m =-

==, 0, 其他值

(3-2)

其中,n =0,1T ,2T ,…,并且N 为帧长,T 为帧移长度。

设第n 帧语音信号Xn(m)的短时能量用En 表示,则其计算公式如下:

1

2

()N n n

m E x

m -==

∑ (3-3)

En 是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感(因为它计算时用的是信号的平方)。为此可采用另一个度量语音信号幅度值变化的函数.即短时平均幅度函数Mn ,它定义为:

1

()N Mn

n m x m -==∑ (3-4)

Mn 也是一帕语音信号能量大小的表征,它与En 的区别在于计算时小取样值和大取样值不会因取平方而造成较大差异,在某些应用领域呻会带来一些好处。

短时能量和短时平均幅度函数的主要用途有:①可以区分浊音段与清音段,因为浊音时En 值比清音时大的多。②可以用来区分声母与韵母的分界,无声与有卢的分界,连字(指

字之间无间隙)的分界等。③作为一种超音段信息,用于语音识别中。 2.2.2短时过零率分析

短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零即意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值改变符号则称为过零。过零率就是样本改变符号的次数。定义语音信号Xn (m )的短时过零率Zn 为:

[][]1

1sgn ()sgn (1)2N n n n m Z x m x m -==--∑ (3-5)

式中,sgn[ ]是符号函数,即:

[]{1,(0)

1,(0)sgn x x x ≥-<= (3-6)

在实际中求过零率参数时,需要十分注意的一个问题是如果输入信号中包含有50Hz 的工频干扰或者A/D 变换器的工作点有偏移(这等效于输入信号有直流偏移),往往会使计算的过零率参数很不准确。为了解决前一个问题,A/D 变换器前的防混叠带通滤波器的低端截频应高于50Hz ,以有效地抑制电源干扰。对于后一个问题除了可以采用低直流漂移器件外,也可以在软件上加以解决,这就是算出每一帧的直流分量并予以滤除。

对语音信号进行分析,发现发浊音时,尽管声道有若干个共振峰,但由于声门波引起谱的高频跌落,所以其话音能量约集中在3kHz 以下。而发清音时,多数能量出现在较高频率上。高频就意味着高的平均过零率,低频意味着低的平均过零率,所以可以认为浊音时具有较低的过零率,而清音时具有较高的过零率。当然,这种高低仅是相对而言,并没方精确的数值关系。

利用短时平均过零率还可以从背景噪声中找出语音信号,可用于判断寂静无声段和有声段的起点和终点位置。在孤立词的语音识别中,必须要在一连串连续的语音信号中进行适当分割,用以确定一个一个单词的语音信号,即找出每一个单词的开始和终止位置,这在语音处理中是一个基本问题。此时,在背景噪声较小时用平均能量识别较为有效,而在背景噪声较大时用平均过零率识别较为有效。但是研究表明,在以某些音为开始或结尾时.如当弱摩擦音 (如[f]、[h]等音素)、弱燃破音(如[p]、[t]、[k]等音素)为语音的开头或结尾;以鼻音(如[n]、 [m]等音素)为语音的结尾时.只用其中一个参量来判别语音的起点和终点是有困难的,必须同时使用这两个参数。图3-1是用Mtalab 仿真一段语音信号时域波形的短时能量和短时平均过零率。

s p e e c h

e n e r g y

z c r

图3-1语音信号的短时能量和短时平均过零率

Figure 3-1 Short-term speech signal energy and zero-crossing rate of the average short-term

2.3 语音信号的语谱图

语音的时域分析和频域分析是语音分析的两种重要方法。显然这两种单独分析的方法均有局限性:时域分析对语音信号的频率特性没有直观的了解;而频域分析出的特征中又没有语音信号随时间的变化关系:语音信号是时变信号,所以其频谱也是随时间变化的。但是由于语音信号随时间变化是很缓慢的,因而在一段短时间内(如10~30ms 之间,即所谓的一帧之内)可以认为其频谱是固定不变的,这种频谱又称为短时谱。短时谱只能反映语音信号的静态频率特性,不能反映语音信号的动态频率特性。因此,人们致力于研究语音的时频分析特性。

把和时序相关的傅里叶分析的显示图形称为语谱图(Sonogram ,或者Spectrogram)。语诺图是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓谈来表示。用语谱图分析语音又称为语谱分析。语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的特点,明显地显示出语音频谱随时间的变化情况,或者说是一种动态的频谱;记录这种频谱的仪器就是语谱仪。

语谱仪实际上是一个带通滤波器组的输出随时间发生连续变化,连续重复进行语音信号频率分析的仪器。带通滤波器有两种带宽可供选择:窄带为45Hz ,宽带为300Hz 。窄带语谱图有良好的频率分辨率,有利于显示基音频率及其各次谐波,但它的时间分辨率较差,不利于观察共振峰(卢道谐振)的变化;而宽带语谱图正相反,具有良好的时间分辨率及较差

的频率分辨率。宽带语谱图能给出语音的共振峰频率及清辅音的能量汇集区,在话谱图里共振峰呈现为黑色的条纹。

可以利用语谱仪测量语谱图的方法来确定语音参数,例如共振峰频率及基音频率。语语图的实际应用是用于确定出讲话人的本性。语谱图上因其不同的黑白程度,形成了个同的纹路,称之为“声纹”,它因人而异,即不同讲话者语谱图的声纹是不同的。因而可以利用声纹鉴别不问的讲话人。这与不向的人有不同的指纹,根据指纹可以区别不同的人是一个道理。虽然对采用语谱图的讲活人识别技术的可靠性过存在相当人的怀疑,但目前这一技术已在司法法庭小得到某些认可及采用[11]。

图3-3是用Mtalab 绘制的一个宽带语谱图,其中横抽坐标为时间,纵轴坐标为频率,语句内容为 “河南农业大学理学院”,它的发音在图下方以音标表示。同时给出了相应的语音的时域波形。语谱图中的花纹有横扛(Bar)、乱纹和竖直条等。横杠是与时间轴平行的几条深黑色带纹,它们相应于短时谱中的几个凸出点,也就是共振峰。从横扛对应的频率和宽度可以确定相应的共振峰频率和带宽。在一个语音段的语谱图中,有没有横扛出现是判断它是否是浊音的重要标志 。竖直条(又叫冲直条)是语谱图中出现与时间轴垂直的一条窄黑条。每个竖直条相当于一个基音,条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音周期。条纹越密表示越音频率越高。

2.2

2.4

2.6

2.8

3

3.2

3.4

3.6 x 10 4

中北大学信息商务学院

50

100

150

200

250

300

350

400

100 150 200 250

图2-3谱图

Figure 3-3, anguage spectra

3语音信号的综合仿真分析

①录制一段自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;

x 10

5

-0.5

0.5

1

原始信号波形

x 10

4

0100

200300400500原始信号频谱

图31原始语音信号

Figure 31 the original speech signal

由图可知这段语音信号频率主要集中在1000hz 左右。

②对语音信号进行调制,为了减少在传输时的耗损,人们一般是先对传输信号进行特殊处理,然后再传递。把原始的待传信号托附到高频振荡的过程称为调制。我们知道音频信号的频率在我们的听觉范围内,音频信号在无线传输的过程中会受到各种声音的干扰而产生能量消耗!因此限制了传输的距离!所以在现实的传送过程中要现对语音信号进行调制再发送出去!

下面是对一段语音信号的调制仿真图,载波频率为fc=20000。

x 10

5

调制后信号波形

x 10

4调制后信号频谱

图3-2调制后的语音信号

Figure3-2 after the speech signal modulation

由图可知,经过调制后的语音信号频谱都搬移到fc=20000的频段。 ③用经过调制的信号与原信号叠加。

0.5

1

1.5

2

2.5x 10

5

-2-1012调制信号+原始信号的波形

0.5

1

1.5

2

2.5

3

3.5

4

x 10

4

01000

200030004000调制信号+原始信号的频谱

图3-3调制后的语音信号+原始语音信号

Figure 3-3 voice modulated signal + the original speech signal

由图可知低频部分是原始信号,高频部分是经过调制后的信号。 ④设计数字滤波器和画出频率响应

根据语音信号的特点给出有关滤波器的性能指标:

低通滤波器性能指标,fp=1000Hz ,fc=1200 Hz , As=100dB ,Ap=1dB ; 用双线性变换法设计的低通滤波器的程序如下: fp=1000;fc=1200;As=100;Ap=1;fs=22050; wc=2*fc/fs;wp=2*fp/fs; [n,wn]=ellipord(wp,wc,Ap,As); [b,a]=ellip(n,Ap,As,wn); freqz(b,a,512,fs); 滤波器的频率响应

2000

40006000

800010000

-1000

-800-600-400-200

Frequency (Hz)

P h a s e (d e g r e e s )

02000

40006000

800010000

-150

-100-500

50

Frequency (Hz)

M a g n i t u d e (d B )

图4-4滤波器的频率响应

Figure 3-4 Frequency response of the filter

⑤进行低通滤波,比较滤波前后语音信号的波形及频谱。

x 10

5

-0.5

0.5

低通滤波后的信号波形

x 10

4

0100200300400低通滤波后信号频谱

总 结

通过这次课程设计,使我对语音信号有了全面的认识,对数字信号处理的知识又有了深刻的理解,在之前数字信号与处理的学习以及完成课后的作业的过程中,已经使用过MATLAB ,对其有了一些基础的了解和认识。通过这次练习是我进一步了解了信号的产生、采样及频谱分析的方法。 以及其中产生信号和绘制信号的基本命令和一些基础编程语言。让我感受到只有在了解课本知识的前提下,才能更好的应用这个工具;并且熟练的应用MATLAB 也可以很好的加深我对课程的理解,方便我的思维。这次设计使我了解了MATLAB 的使用方法,学会分析滤波器的优劣和性能,提高了分析和动手实践能力。同时我相信,进一步加强对MATLAB 的学习与研究对我今后的学习将会起到很大的帮助。

附录一:

%语音信号时域频域分析

[y,Fs,bits]=wavread('2.wav');%读出信号,采样率和采样位数。

y=y(:,1);%我这里假设你的声音是双声道,我只取单声道作分析,如果你想分析另外一个声道,请改成y=y(:,2)

sigLength=length(y); Y = fft(y,sigLength);

Pyy = Y.* conj(Y) / sigLength;

halflength=floor(sigLength/2);

f=Fs*(0:halflength)/sigLength;

figure;plot(f,Pyy(1:halflength+1));xlabel('Frequency(Hz)');

t=(0:sigLength-1)/Fs;

figure;plot(t,y);xlabel('Time(s)');

附录二:

%抽取的源程序

[y,fs,bs]=wavread('d:\01.wav',[25000,75000]);

y=y(:,1);

lg=length(y);

yx=(0:(lg-1))*fs/lg;

yx=yx(1:lg/2);

% sound(y,fs);

figure(1);

subplot(211);

plot(y);

title('原始信号');

subplot(212);

yf=abs(fft(y));

yf=yf(1:lg/2);

plot(yx,yf);

ycq=zeros(1,lg); %先将抽取后的值全设为零

for i=1:80:lg; %通过循环,每隔80个点将抽取后的值赋值为原函数的ycq(i)=y(i); %采样值

end

sound(ycq,fs);

figure(2);

subplot(211);

plot(ycq);

title('抽取后的信号');

subplot(212);

ycqf=abs(fft(ycq));

ycqf=ycqf(1:lg/2);

plot(yx,ycqf);

附录三:

“中北大学信息商务学院”语谱图源程序:

frmsize = 256; % 设置贞大小

[x,fs,nbits] = wavread('3.wav'); % 读取语音文件

x = filter([1 -0.95],[1],x); % 高频预加重,抵消频谱倾斜

n = length(x); frmcnt = floor(n/frmsize);

x = reshape(x(1:frmsize*frmcnt),frmsize,frmcnt); % 分帧

xFFT = abs(fft(x)); % 傅里叶谱

xFFT = xFFT(1:frmsize/2,1:frmcnt); % 奈奎斯特频率以内是无效的

xFFTdB = 20*log10(xFFT+eps); % 换算成分贝

xFFTdB(xFFTdB>+20) = +20; % 能量太高的截断

xFFTdB(xFFTdB<-40) = -40; % 能量太低的截断

xFFTdB = (xFFTdB+40); % 能量整理到[0,60] 之间,当然你可以整理到[0,255]范围subplot(2,1,1);plot(x(1:frmsize*frmcnt)); title('河南农业大学理学院'); % 画波形subplot(2,1,2);image(flipud(xFFTdB)); colormap(jet)% 画语谱图

附录四:

语音信号的综合仿真分析程序:

[y,fs,bits]=wavread('3.wav');

% sound(y,fs,bits);

Y=fft(y,40000);%采样点数40000

figure(1);

subplot(211);plot(y);title('原始信号波形');

subplot(212);plot(abs(Y));title('原始信号频谱');

fc=20000;%载波频率

y1=modulate(y,fc,fs,'fm');%对原语音信号调制

Y1=fft(y1,40000);%采样点数40000

figure(2);

subplot(211);plot(y1);title('调制后信号波形');

subplot(212);plot(abs(Y1));title('调制后信号频谱');

% sound(y1);

y2=y+y1;

Y2=fft(y2,40000);%采样点数40000

figure(3);

subplot(211);plot(y2);title('调制信号+原始信号波形');

subplot(212);plot(abs(Y2));title('调制信号+原始信号频谱');

% sound(y2);

figure(4);

fp=1000;fc=1200;As=100;Ap=1;fs1=22050;

wc=2*fc/fs1;wp=2*fp/fs1;

[n,wn]=ellipord(wp,wc,Ap,As);

[b,a]=ellip(n,Ap,As,wn);

freqz(b,a,512,fs1);

x=filter(b,a,y2);

X=fft(x,40000);

figure(5);

subplot(211);plot(x);title('低通滤波后信号波形');

subplot(212);plot(abs(X));title('低通滤波后信号频谱');

sound(x,40000);

附录五:

%短时能量,短时过零率[7]

% function [x1,x2]=vad(x)

[x,Fs,bits] = wavread('one')

specgram(x,240,8000,80);

x=double(x);

x=x/max(abs(x));%将幅度归一化到[-1,1]

framelen=240;

frameinc=80;%设定帧长为240帧移为80

amp1=10;

amp2=2;

zcr1=10;

zcr2=5;

maxsilence=3;

minlen=15;

status=0;

count=0;

silence=0;

temp1=enframe(x(1:length(x)-1),framelen,frameinc);

temp2=enframe(x(2:length(x)),framelen,frameinc);

signs=(temp1.*temp2)<0;

diffs=(temp1-temp2)>0.02;

zcr=sum(signs.*diffs,2);%计算过零率

amp=sum(abs(enframe(x(1:length(x)-1),framelen,frameinc)),2); %计算短时能量%调整能量门限

amp1=min(amp1,max(amp)/4);

amp2=min(amp2,max(amp)/8);

%开始零点检测

x1=0;

x2=0;

for n=1:length(zcr);

goto=0;

switch status

case{0,1} %静音=0,1开始

if amp(n)>amp1 %确信进入语音阶段

x1=max(n-count-1,1);

status=2;

silence=0;

count=count+1;

elseif amp(n)>amp2|... %可能处在语音段

zcr(n)>zcr2

status=1;

count=count+1;

else %静音状态

status=0;

count=0;

end

应用Matlab对含噪声语音信号进行频谱分析及滤波

应用Matlab对含噪声的语音信号进行频谱分析及滤波 一、实验内容 录制一段个人自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;在语音信号中增加正弦噪声信号(自己设置几个频率的正弦信号),对加入噪声信号后的语音信号进行频谱分析;给定滤波器的性能指标,采用窗函数法和双线性变换设计数字滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比试听,分析信号的变化。 二、实现步骤 1.语音信号的采集 利用Windows下的录音机,录制一段自己的话音,时间在1 s内。然后在Matlab软件平台下,利用函数wavread对语音信号进行采样,(可用默认的采样频率或者自己设定采样频率)。 2.语音信号的频谱分析 要求首先画出语音信号的时域波形;然后对语音号进行快速傅里叶变换,得到信号的频谱特性。 在采集得到的语音信号中加入正弦噪声信号,然后对加入噪声信号后的语音号进行快速傅里叶变换,得到信号的频谱特性。并利用sound试听前后语音信号的不同。

分别设计IIR和FIR滤波器,对加入噪声信号的语音信号进行去噪,画出并分析去噪后的语音信号的频谱,并进行前后试听对比。 3.数字滤波器设计 给出数字低通滤波器性能指标:如,通带截止频率fp=10000 Hz,阻带截止频率fs=12000 Hz(可根据自己所加入噪声信号的频率进行阻带截止频率设置),阻带最小衰减Rs=50 dB,通带最大衰减Rp=3 dB(也可自己设置),采样频率根据自己语音信号采样频率设定。

报告内容 一、实验原理 含噪声语音信号通过低通滤波器,高频的噪声信号会被过滤掉,得到清晰的无噪声语音信号。 二、实验内容 录制一段个人自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;在语音信号中增加正弦噪声信号(自己设置几个频率的正弦信号),对加入噪声信号后的语音信号进行频谱分析;给定滤波器的性能指标,采用窗函数法和双线性变换设计数字滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比试听,分析信号的变化。给出数字低通滤波器性能指标:如,通带截止频率fp=10000 Hz,阻带截止频率fs=12000 Hz (可根据自己所加入噪声信号的频率进行阻带截止频率设置),阻带最小衰减Rs=50 dB,通带最大衰减Rp=3 dB(也可自己设置),采样频率根据自己语音信号采样频率设定。 三、实验程序 1、原始信号采集和分析 clc;clear;close all; fs=10000; %语音信号采样频率为10000 x1=wavread('C:\Users\acer\Desktop\voice.wav'); %读取语音信号的数据,赋给x1 sound(x1,40000); %播放语音信号 y1=fft(x1,10240); %对信号做1024点FFT变换 f=fs*(0:1999)/1024; figure(1); plot(x1) %做原始语音信号的时域图形 title('原始语音信号'); xlabel('time n'); ylabel('fuzhi n'); figure(2); plot(f,abs(y1(1:2000))); %做原始语音信号的频谱图形 title('原始语音信号频谱') xlabel('Hz'); ylabel('fuzhi');

利用labview进行信号的时域分析

利用labview进行信号的时域分析 信号的时域分析主要是测量测试信号经滤波处理后的特征值,这些特征值以一个数值表示信号的某些时域特征,是对测试信号最简单直观的时域描述。将测试信号采集到计算机后,在测试VI 中进行信号特征值处理,并在测试VI 前面板上直观地表示出信号的特征值,可以给测试VI 的使用者提供一个了解测试信号变化的快速途径。信号的特征值分为幅值特征值、时间特征值和相位特征值。 用于信号时域分析的函数,VIs,Express VIs主要位于函数模板中的Signal Processing子模板中,其中多数对象位于Waveform Measurements子模板,如图所示 LabVIEW8.0中用于信号分析的Waveform Measurements子模板 基本平均值与均方差VI 基本平均值与均方差VI-------Basic Averaged DC—RMS.vi用于测量信号的平均以及均方差。计算方法是在信号上加窗,即将原有信号乘以一个窗函数,窗函数的类型可以选择矩形窗、Haning窗、以及Low side lob窗,然后计算加窗后信号的均值以及均方差值。 演示程序的前面板和后面板如下图所示 Basic Averaged DC—RMS演示程序的前面板

Basic Averaged DC—RMS演示程序的后面板 平均值与均方差值 平均值与均方差值VI------Averaged DC—RMS.vi同样也是用于计算信号的平均值与均方差值,只是Averaged DC—RMS.vi的输出是一个波形函数,这里我们可以看到加窗截断后,正弦信号的平均值和均方差随时间变化的波形。 编写程序演示Average DC----Averaged—RMS.vi的使用方法,程序的后面板和前面板如下图所示 Averaged DC—RMS演示程序的后面板

北京交通大学信号与系统时域分析

北京交通大学信号与系统时域分析

【研讨题目2】 信号与系统时域分析专题研讨 【目的】 1.研究用离散方法近似计算连续信号的卷积积分; 2.通过分析近似计算卷积积分过程中出现的问题,锻炼学生分析问题和解决问题的能力; 【知识点】 信号时域分析,卷积积分,卷积和 【研讨题目】连续信号卷积积分的数值近似计算 两个连续信号的卷积积分定义为 τττd )()()(-= ?∞ ∞ -t h x t y 为了能用数值方法进行计算,需对连续信号进行抽样。记x [k ]=x (k ), h [k ]=h (k ),为 进行数值计算所选定的抽样间隔,可以证明连续信号卷积积分可近似的表示为 (Δ)Δ([][])y k x k h k ≈?* (1) 由式(1)可知,可以利用Matlab 提供的conv 函数近似计算连续信号的卷积积分。 一、(*)理论分析 为了对近似计算的结果进行分析,用解析的方法计算下列卷积积分,推出卷积积分的解析表达式; (1) 时限信号卷积积分 x 1(t )=u (t )-u (t -1),y 1(t )=x 1(t )*x 1(t ); 卷积结果为:y1(t)= x 1(t )*x 1(t )=r(t)-2*r(t-1)+r(t-2) (2) 分段常数信号卷积积分 x 2(t )= x 1(t )+2 x 1(t -1)+ x 1(t -2),h 2(t )= x 1(t )- x 1(t -1), y 2(t )=x 2(t )*h 2(t ); 卷积结果为:y2(t)= x 2(t )*h 2(t ) =y1(t)+y1(t-1)-y1(t-2)-y1(t-3) =r(t)-r(t-1)-2*r(t-2)+2*r(t-3)+r(t-4)-r(t-5) (3) 非时限信号卷积积分 x 3(t )=u (t ),h 3(t )=e -t u (t ), y 3(t )=x 3(t )*h 3(t ) 卷积结果为:y3= x 3(t )*h 3(t ) =[1-exp(-t)]*u(t) 二、(*)时限信号卷积积分的近似计算 取不同的△值,用Matlab 函数conv 近似计算卷积积分y 1(t )并画出其波形,讨论的取值对计算结果的影响。

语音信号时域分析

基于MATLAB 分析语音信号时域特征 钱平(信号与信息处理 s101904010) 一、时域特征实验原理及实验结果分析 1.窗口的选择 通过对发声机理的认识,语音信号可以认为是短时平稳的。在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。我们将每个短时的语音称为一个分析帧。一般帧长取10~30ms 。我们采用一个长度有限的窗函数来截取语音信号形成分析帧。通常会采用矩形窗和汉明窗。图1给出了这两种窗函数在帧长N=50时的时域波形。 0.2 0.40.60.811.2 1.41.61.82矩形窗 sample w (n ) 0.1 0.20.30.40.50.6 0.70.80.91hanming 窗 sample w (n ) 图1 矩形窗和Hamming 窗的时域波形 矩形窗的定义:一个N 点的矩形窗函数定义为如下 ()? ? ?<≤=其他001N n n w hamming 窗的定义:一个N 点的hamming 窗函数定义为如下 ()?? ??? <≤--=其他00)1 2cos(46.054.0N n N n n w π 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图 2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。表1对比了这两种窗函数的主瓣宽度和旁瓣峰值。

语音信号分析与处理2011

数字信号处理实验二:语音信号分析与处理 学号 姓名 注:1)此次实验作为《数字信号处理》课程实验成绩的重要依据,请同学们认真、独立完成,不得抄袭。 2)请在授课教师规定的时间内完成; 3)完成作业后,请以word 格式保存,文件名为:学号+姓名 4)请通读全文,依据第2及第3 两部分内容,认真填写第4部分所需的实验数据,并给出程序内容。 1. 实验目的 (1) 学会MATLAB 的使用,掌握MATLAB 的程序设计方法 (2) 掌握在windows 环境下语音信号采集的方法 (3) 掌握MATLAB 设计FIR 和IIR 滤波器的方法及应用 (4) 学会用MATLAB 对语音信号的分析与处理方法 2. 实验内容 录制一段自己的语音信号,对录制的语音信号进行采样,画出采样后语音信号的时域波形和频谱图,确定语音信号的频带范围;使用MATLAB 产生白噪声信号模拟语音信号在处理过程中的加性噪声并与语音信号进行叠加,画出受污染语音信号的时域波形和频谱图;采用双线性法设计出IIR 滤波器和窗函数法设计出FIR 滤波器,画出滤波器的频响特性图;用自己设计的这两种滤波器分别对受污染的语音信号进行滤波,画出滤波后语音信号的时域波形和频谱图;对滤波前后的语音信号进行时域波形和频谱图的对比,分析信号的变化;回放语音信号,感觉与原始语音的不同。 3. 实验步骤 1)语音信号的采集与回放 利用windows 下的录音机或其他软件录制一段自己的语音(规定:语音内容为自己的名字,以wav 格式保存,如wql.wav ),时间控制在2秒之内,利用MATLAB 提供的函数wavread 对语音信号进行采样,提供sound 函数对语音信号进行回放。 [y,fs,nbits]=wavread(file), 采样值放在向量y 中,fs 表示采样频率nbits 表示采样位数。Wavread 的更多用法请使用help 命令自行查询。 2)语音信号的频谱分析 利用fft 函数对信号进行频谱分析 3)受白噪声干扰的语音信号的产生与频谱分析 ①白噪声的产生: N1=sqrt (方差值)×randn(语音数据长度,2)(其中2表示2列,是由于双声道的原因) 然后根据语音信号的频谱范围让白噪声信号通过一个带通滤波器得到一个带限的白噪声信号 N2; 带通滤波器的冲激响应为: h B (n )= ))((sin ))((sin 1122απ ωπωαπωπω---n c n c c c c c

离散信号与系统时域分析

目录 第1章设计任务及要求 (1) 1.1课程设计内容 (1) 1.2课程设计要求 (1) 第2章设计原理 (2) 2.1离散信号与系统的时域分析设计 (2) 2.1.1描写系统特性的方法介绍 (2) 2.1.2系统的时域特性 (2) 第3章设计实现 (3) 3.1实验内容与方法 (3) 3.1.1实验内容 (3) 第4章设计结果及分析 (3) 4.1程序设计结果及分析 (4) 总结 (7) 参考文献: (7) 附录: (8)

第1章 设计任务及要求 1.1课程设计内容 编制Matlab 程序,完成以下功能,产生系统输入信号;根据系统差分方程求解单位脉冲响应序列;根据输入信号求解输出响应;用实验方法检查系统是否稳定;绘制相关信号的波形。具体要求如下: (1) 给定一个低通滤波器的差分方程为 ()0.05()0.05(1)0.9(1)y n x n x n y n =+-+- 输入信号分别为182()=()()()x n R n x n u n =, ① 分别求出系统响应,并画出其波形。 ② 求出系统的单位脉冲响应,画出其波形。 (2) 给定系统的单位脉冲响应为1102()=()()() 2.5(1) 2.5(2)(3)h n R n h n n n n n δδδδ=+-+-+-,用线性卷积法求18()=()x n R n 分别对系统h1(n)和h2(n)的输出响应,并画出波形。 (3) 给定一谐振器的差分方程为() 1.8237(1)-0.9801(2)()(2)o o y n y n y n b x n b x n =--++-令b0=1/100.49,谐振器的谐振频率为0.4rad 。 1) 用实验方法检查系统是否稳定。输入信号为u(n)时,画出系统输出波形。 2) 给定输入信号为()=sin(0.014)sin(0.4)x n n n +求出系统的输出响应,并画出其波形。 1.2课程设计要求 1. 要求独立完成设计任务。 2. 课程设计说明书封面格式要求见《天津城市建设学院课程设计教学工作规范》附表1 3. 课程设计的说明书要求简洁、通顺,计算正确,图纸表达内容完整、清楚、规范。 4. 简述离散系统时域分析方法和通过实验判断系统稳定性的方法;完成以上设计实验并对结果进行分析和解释;打印程序清单和要求画出的信号波形;写出本次课程设计的收获和体会。 5. 课设说明书要求: 1) 说明题目的设计原理和思路、采用方法及设计流程。 2) 详细介绍运用的理论知识和主要的Matlab 程序。 3) 绘制结果图形并对仿真结果进行详细的分析。

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

应用matlab对语音信号进行频谱分析及滤波.

数字信号处理 —综合实验报告 综合实验名称:应用MatLab对语音信号进行 频谱分析及滤波 系: 学生姓名: 班级: 学号: 成绩: 指导教师: 开课时间学年学期

目录 一.综合实验题目 (1) 二、综合实验目的和意义 (1) 2.1 综合实验目的 (1) 2.2 综合实验的意义 (1) 三.综合实验的主要内容和要求 (1) 3.2 综合实验的要求: (2) 四.实验的原理 (2) 4.1 数字滤波器的概念 (2) 4.2 数字滤波器的分类 (2) (1)根据单位冲激响应h(n)的时间特性分类 (2) 五.实验的步骤 (3) 下面对各步骤加以具体说明。 5.1语音信号的采集 (3) 5.2 语音信号的频谱分析; (3) 5.3 设计数字滤波器和画出其频率响应 (5) 5.3.1设计数字滤波器的性能指标: (5) 5.3.2 用Matlab设计数字滤波器 (6) 5.6 设计系统界面 (19) 六、心得体会 (20) 参考文献: (21)

一.综合实验题目 应用MatLab对语音信号进行频谱分析及滤波 二、综合实验目的和意义 2.1 综合实验目的 为了巩固所学的数字信号处理理论知识,使学生对信号的采集、处理、传输、显示和存储等有一个系统的掌握和理解,再者,加强学生对Matlab软件在信号分析和处理的运用 综合运用数字信号处理的理论知识进行频谱分析和滤波器设计,通过理论推导得出相应结论,再利用 MATLAB 作为编程工具进行计算机实现,从而加深对所学知识的理解,建立概念。 2.2 综合实验的意义 语言是我们人类所特有的功能,它是传承和记载人类几千年文明史,没有语言就没有我们今天人类的文明。语音是语言最基本的表现形式,是相互传递信息最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展;它是研究用数字信号处理技术对语音信号进行处理的一门新兴学科,同时又是综合性的多学科领域和涉及面很广的交叉学科,因此我们进行语言信号处理具有时代的意义。 三.综合实验的主要内容和要求 3.1综合实验的主要内容: 录制一段个人自己的语音信号,并对录制的信号进行采样;画出采样后语音信号的时域波形和频谱图;给定滤波器的性能指标,采用窗函数法和双线性变换设计滤波器,并画出滤波器的频率响应;然后用自己设计的滤波器对采集的信号进行滤波,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化;回放语音信号;综合实验应完成的工作: (1)语音信号的采集; (2)语音信号的频谱分析;

信号与系统实验报告实验一 信号与系统的时域分析

实验一信号与系统的时域分析 一、实验目的 1、熟悉与掌握常用的用于信号与系统时域仿真分析的MA TLAB函数; 2、掌握连续时间与离散时间信号的MA TLAB产生,掌握用周期延拓的方法将一个非周期信号进行周期信号延拓形成一个周期信号的MA TLAB编程; 3、牢固掌握系统的单位冲激响应的概念,掌握LTI系统的卷积表达式及其物理意义,掌握卷积的计算方法、卷积的基本性质; 4、掌握利用MA TLAB计算卷积的编程方法,并利用所编写的MA TLAB程序验证卷积的常用基本性质; 掌握MA TLAB描述LTI系统的常用方法及有关函数,并学会利用MATLAB求解LTI系统响应,绘制相应曲线。 基本要求:掌握用MA TLAB描述连续时间信号与离散时间信号的方法,能够编写MATLAB程序,实现各种信号的时域变换与运算,并且以图形的方式再现各种信号的波形。掌握线性时不变连续系统的时域数学模型用MA TLAB描述的方法,掌握卷积运算、线性常系数微分方程的求解编程。 二、实验原理 信号(Signal)一般都就是随某一个或某几个独立变量的变化而变化的,例如,温度、压力、 声音,还有股票市场的日收盘指数等,这些信号都就是随时间的变化而变化的,还有一些信号,例如在研究地球结构时,地下某处的密度就就是随着海拔高度的变化而变化的。一幅图片中的每一个象素点的位置取决于两个坐标轴,即横轴与纵轴,因此,图像信号具有两个或两个以上的独立变量。 在《信号与系统》课程中,我们只关注这种只有一个独立变量(Independent variable)的信号,并且把这个独立变量统称为时间变量(Time variable),不管这个独立变量就是否就是时间变量。 在自然界中,大多数信号的时间变量都就是连续变化的,因此这种信号被称为连续时间信号(Continuous-Time Signals)或模拟信号(Analog Signals),例如前面提到的温度、压力与声音 信号就就是连续时间信号的例子。但就是,还有一些信号的独立时间变量就是离散变化的,这种信号称为离散时间信号。前面提到的股票市场的日收盘指数,由于相邻两个交易日的日收盘指数相隔24小时,这意味着日收盘指数的时间变量就是不连续的,因此日收盘指数就是离散时间信号。 而系统则用于对信号进行运算或处理,或者从信号中提取有用的信息,或者滤出信号中某些无用的成分,如滤波,从而产生人们所希望的新的信号。系统通常就是由若干部件或单元组成的一个整体(Entity)。系统可分为很多不同的类型,例如,根据系统所处理的信号的不同,系统可分为连续时间系统(Continuous-time system)与离散时间系统(Discrete-time system),根

数字信号处理 语音信号分析与处理及其MATLAB实现..

摘要 (2) 1 设计目的与要求 (3) 2 设计步骤 (4) 3 设计原理及内容 (5) 3.1 理论依据 (5) 3.2 信号采集 (6) 3.3 构造受干扰信号并对其FFT频谱分析 (8) 3.4 数字滤波器设计 (9) 3.5 信号处理 (10) 总结 (12) 致谢 (13) 参考文献 (14)

用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波

1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。

语音信号特征的提取

语音信号特征的提取 摘要 随着计算机技术的发展,语音交互已经成为人机交互的必要手段,语音特征参数的精确度直接影响着语音合成的音质和语音识别的准确率。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 本文采用Matlab软件提取语音信号特征参数,首先对语音信号进行数字化处理,其次,进行预处理,包括预加重、加窗和分帧,本文讨论了预处理中各种参数的选择,以使信号特征提取更加准确。第三,讨论了各种时域特征参数的算法,包括短时能量、短时过零率等。 关键词:语音信号, 特征参数, 提取, Matlab 目录 第一章绪论 1.1语音信号特征提取概况 1.1.1研究意义 语音处理技术广泛应用于语音通信系统、声控电话交换、数据查询、计算机控制、工业控制等领域,带有语音功能的计算机也将很快成为大众化产品,语音将可能取代键盘和鼠标成为计算机的主要输入手段,为用户界面带来一次飞跃。 语音信号特征的提取是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信和准确的语音识别,才能建立语音合成的语音库。因此语音信号参数提取是语音信号处理研究中一项非常有意义的工作。 1.1.2 发展现状 语音信号处理是一门综合性的学科,包括计算机科学、语音学、语言学、声学和数学等诸多领域的内容。它的发展过程中,有过两次飞跃。第一次飞跃是1907年电子管的发明和1920年无线电广播的出现,电子管放大器使很微弱的声

音也可以放大和定量测量,从而使电声学和语言声学的一些研究成果扩展到通信和广播部门;第二次飞跃是在20世纪70年代初,电子计算机和数字信号处理的发展使声音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化转换为数字信号,这样就可以用数字计算方法对语音信号进行处理和加工,提高了语音信号处理的准确性和高效性。 语音信号处理在现代信息科学中的地位举足轻重,但它仍有些基础的理论问题和技术问题有待解决,这些难题如听觉器官的物理模型和数学表示及语音增强的技术理论等,目前还有待发展。 1.2 本课题研究内容 本文主要介绍语音信号处理的理论及Matlab的相关内容,然后从Matlab仿真角度验证了录音、预处理、提取语音信号时域特征参数,主要讨论了预处理中各种参数的选择,以使信号特征提取更加准确。再次讨论了各种时域特征参数的算法,包括短时能量、短时过零率等,介绍了各环节的不同软件实现方法。最后对基于Matlab的语音信号特征参数提取进行总结。 第二章Matlab简介 MATLAB是国际上仿真领域最权威、最实用的计算机工具。它是MathWork 公司于1984年推出,它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境,特别是所附带的30多种面向不同领域的工具箱支持,使得它在许多科学领域中成为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。 2.1 发展概况 Matlab是Matrix Laboratory(矩阵实验室的缩写),最初由美国Cleve Moler 博士在70年代末讲授矩阵理论和数据分析等课程时编写的软件包Linpack与Eispack组成,旨在使应用人员免去大量经常重复的矩阵运算和基本数学运算等繁琐的编程工作。1984年成立的Math Works公司正式把Matlab推向市场,并从事Matlab的研究和开发。1990年,该公司推出了以框图为基础的控制系统仿真工具Simulink,它方便了系统的研究与开发,使控制工程师可以直接构造系统框图进行仿真,并提供了控制系统中常用的各种环节的模块库。1993年,Math Works 公司推出的Matlab4.0版在原来的基础上又作了较大改进,并推出了Windows版,

连续时间信号的抽样及频谱分析-时域抽样信号的频谱--信号与系统课设

1 引言 随着科学技术的迅猛发展,电子设备和技术向集成化、数字化和高速化方向发展,而在学校特别是大学中,要想紧跟技术的发展,就要不断更新教学和实验设备。传统仪器下的高校实验教学,已严重滞后于信息时代和工程实际的需要。仪器设备很大部分陈 旧,而先进的数字仪器(如数字存储示波器)价格昂贵不可能大量采购,同时其功能较为单一,与此相对应的是大学学科分类越来越细,每一专业都需要专用的测量仪器,因此仪器设备不能实现资源共享,造成了浪费。虚拟仪器正是解决这一矛盾的最佳方案。基于PC 平台的虚拟仪器,可以充分利用学校的微机资源,完成多种仪器功能,可以组合成功能强大的专用测试系统,还可以通过软件进行升级。在通用计算机平台上,根据测试任务的需要来定义和设计仪器的测试功能,充分利用计算机来实现和扩展传统仪器功能,开发结构简单、操作方便、费用低的虚拟实验仪器,包括数字示波器、频谱分析仪、函数发生器等,既可以减少实验设备资金的投入,又为学生做创新性实验、掌握现代仪器技术提供了条件。 信号的时域分析主要是测量测试信号经滤波处理后的特征值,这些特征值以一个数值表示信号的某些时域特征,是对测试信号最简单直观的时域描述。将测试信号采集到计算机后,在测试VI 中进行信号特征值处理,并在测试VI 前面板上直观地表示出信号的特征值,可以给测试VI 的使用者提供一个了解测试信号变化的快速途径。信号的特征值分为幅值特征值、时间特征值和相位特征值。 尽管测量时采集到的信号是一个时域波形,但是由于时域分析工具较少,所以往往把问题转换到频域来处理。信号的频域分析就是根据信号的频域描述来估计和分析信号的组成和特征量。频域分析包括频谱分析、功率谱分析、相干函数分析以及频率响应函数分析。 信号在时域被抽样后,他的频谱X(j )是连续信号频谱X(j )的形状以抽样频率为间隔周期重复而得到,在重复过程中幅度被p(t)的傅里叶级数Pn加权。因为Pn只是n的函数,所以X(j )在重复的过程中不会使其形状发生变化。假定信号x(t)的频谱限制在- m~+ m的范围内, 若以间隔Ts对xa(t)进行抽样,可知抽样信号X^(t)的频谱X^(j )是以s为周期重复。显然,若在抽样的过程中s<2 m,则X^(j )将发生频谱混叠现象,只有在抽样的过程中满足s>=2 m条件,X^(j )才不会产生频谱的混叠,接收端完全可以由x^(t)恢复原连续信号xa(t),这就是低通信号抽样定理的核心内容。

语音信号的时域特征分析

中北大学 课程设计说明书 学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 学院:信息商务学院 专业:电子信息工程 题目:信息处理实践:语音信号的时域特征分析指导教师:徐美芳职称: 讲师 2013 年 6 月 28 日

中北大学 课程设计任务书 2012-2013 学年第二学期 学院:信息商务学院 专业:电子信息工程 学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 课程设计题目:信息处理实践:语音信号的时域特征分析起迄日期: 2013年6 月7日~2013年6月 28 日 课程设计地点:学院楼201实验室、510实验室、608实验室指导教师:徐美芳 系主任:王浩全 下达任务书日期: 2013 年 6 月 7 日

语音信号的采集与分析 摘要 语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。 关键词:语音信号,采集与分析, Matlab 0 引言 通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。 语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。语音信号采集与分析是以语音语言学和数字

语音信号特征参数研究

语音信号特征参数研究 石海燕 (浙江工业大学信息工程学院,浙江杭州310032) 摘要:在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。 关键词:语音信号;特征参数;短时能量 中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)04-10754-04 StudyonSpeechSignalFeatureParameter SHIHai-yan (CollegeofInformationEngineering,ZhejiangUniversityofTechnology,Hangzhou310032,China) Abstract:Intheprocessofdevelopingspeechtechnologyusedinalargenumberofspeechsignalfeatureparameters,agoodspeechsignalfeatureparametersplayedacriticalroleinspeechrecognition.Inthispaperweintroducedthespeechsignalfeatureparameters,thespeechsignalfeatureparametersselection,andintroducedshort-termenergy、short-termaveragerangeextraction. Keywords:speechsignal;featureparameter;short-termenergy 1引言 在语音识别的发展过程中使用了大量的语音信号特征参数。特征参数的提取是关系到语音识别系统性能好坏的一个关键技术,其基本思想是将预处理过的信号通过一次变换,去掉冗余部分,而把代表语音本质的特征参数抽出来。接下去所要作的识别处理都是建立在特征参数之上的,如果特征参数不能很好地反映语音信号的本质,识别就不能成功。 语音信号特征参数是分帧提取的,每帧特征参数一般构成一个矢量,所以语音信号特征是一个矢量序列。我们将语音信号切成一帧一帧,每帧大小大约是20 ̄30ms。帧太大就不能得到语音信号随时间变化的特性,帧太小就不能提取出语音信号的特征,每帧语音信号中包含数个语音信号的基本周期。有时希望相邻帧之间的变化不是太大,帧之间就要有重叠,帧叠往往是帧长的1/2或1/3。帧叠大,相应的计算量也大。 常用的语音特征参数有平均能量、平价跨零数或跨零率、共振峰、LPC参数、倒谱参数、临界带倒谱等。下一节介绍一些常用的语音特征。 2语音信号特征参数介绍 (1)基音周期(Pitch) 人的语音基本上由两类构成,一类是浊音(voice),另一类是清音(unvoice)。浊音的语音信号具有较强的周期性,不同的浊音波形是不同的。浊音的这种周期叫基音周期,其倒数叫做基音频率,它主要和声带的特性有关。一般来说,成年男性的语音的基音频率在60Hz ̄200Hz,而成年女性和儿童语音的基音频率在200Hz ̄450Hz。清音的语音信号具有随机噪声的特点,一般来说清音的幅度小于浊音的幅度。基音周期(Pitch)是指发浊音时声带震动所引起的周期运动时间间隔,代表声带震动的快慢,震动越快音高会越高,基音周期是声带振动频率F0的倒数,它是语音信号分析的一个重要参数。 (2)短时频谱 语音信号特征在较短的时间间隔中保持基本不变,即语音信号具有时变特性,因而可以将语音信号看作是一个短时平稳过程。语音信号具有一些重要的短时特征。短时频谱是语音信号的一个重要的短时特性。可以用下列公式计算: (1) 收稿日期:2008-01-12 个人简介:石海燕(1977-),女,浙江诸暨人,实验师,主要研究方向:语音处理、模式识别。

MATLAB语音信号的时域分析

语音信号的时域与频域分析 一、用MATLAB实现语音信号的时域分析 1.MATLAB程序代码 (1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。所用程序代码为: clear; close all;Fs=8000; y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'f:\\a'); soundview(y,Fs,'name') (2)读取WAV文件,显示语音信号的波形。所用程序代码为: x=wavread('f:\\a.wav'); figure;plot(x); axis([0,size(x,1),-0.35,0.3]);%坐标轴范围 title('语音信号时域波形'); xlabel('样点数'); ylabel('幅度'); (3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为20)。所用程序代码为: x=wavread('f:\\a.wav'); x=double(x); f=enframe(x,20,100); energy=sum(abs(f),2); subplot(2,2,1);plot(x); axis([0,size(x,1),-0.7,0.9]); title('语音信号时域波形');xlabel('样点数'); ylabel('幅度');subplot(2,2,2);plot(energy); title('语音信号的短时能量'); legend('帧长LEN=20'); f=enframe(x,20,200); energy=sum(abs(f),2); subplot(2,2,3);plot(energy); title('语音信号的短时能量'); legend('帧长LEN=100');f=enframe(x,20,400);energy=sum(abs(f),2); subplot(2,2,4);plot(energy);title('语音信号的短时能量');legend('帧长LEN=200'); (4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为: x=wavread('f:\\a.wav'); x=double(x); LEN=100;INC=100; f=enframe(x,LEN,INC);%分帧%计算短时过零率

相关主题
文本预览
相关文档 最新文档