当前位置：文档之家› DSP语音识别实验报告

DSP语音识别实验报告

DSP课程设计

实验报告

语音识别

院（系）：电子信息工程学院自动化系

设计人员：李彬学号：07212072设计人员：宋淦泉学号：07212077

评语：

指导教师签字：

日期：

一、设计任务书

1、实验概述

2、实验目的

二、设计内容

三、设计方案、算法原理说明

1、设计步骤

2、算法原理说明

四、程序设计、调试与结果分析

1、算法流程图

2、主程序

3、测试过程及结果分析

五、设计（安装）与调试的体会

1、编程及程序运行中遇到的问题及解决办法

2、本次实验的心得体会

六、参考文献

一、设计任务书

实验概述：

语言是人类特有的功能，声音是人类最常用的工具。通过语音传递信息是人类最重要最有效最常用和最方便的信息交换形式。语音信号是人类进行思想沟通和情感交流的最主要的途径。让计算机能听懂人类的语言，是自计算机诞生以来人类梦寐以求的想法。在本实验中，将针对ＤＴＷ算法，实现对最简单的单音信号进行语音识别的问题。

语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言（例如人在说话时的表情、手势等细微动作可帮助对方理解），其最终目标是实现人与机器进行自然语言通信。

语音识别技术主要包括特征提取技术、模式匹配准则及模训练技术三个方面。此外，还涉及到语音识别单元的选取。

语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等多种学科领域，是一个多学科综合性研究领域。

语音识别系统的分类---根据对说话人说话方式的要求，可以分为孤立字（词）语音识别系统、连接字语音识别系统以及连续字语音识别系统。根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。根据词汇量大小，可以分为小词汇量、中等词汇量、大词汇

量以及无限量词汇量语音识别系统。

一般来说，语音识别的方法有三种：基于声道模型和语音知识的方法、模版匹配的方法以及利用人工神经网络的方法。

基于声道模型和语音知识的方法起步较早，在语音识别技术提出的开始，就有了这方面的研究。但由于其模型及语音知识过于复杂，还没有达到实用阶段。

人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络本质上是一个自适应非线性动力学系统，模拟人类神经活动的原理，具有自适应性、并行性、鲁棒性、容错性和学习特性，在结构和算法上都显示出实力。但由于存在训练、识别时间太长的缺点，目前仍处于实验探索阶段。

模版匹配方法中，要经过四个步骤：特征提取、模版训练、模版分类、判决。

实验目的：

1、掌握5402DSP片上外设TLC320AD50 CODEC编译码的内

部结构、工作原理以及在C语言下的编程方法；

2、掌握通过C语言实现5402DSP片上外设FLASH的读写操

作；

3、掌握FFT(快速傅里叶变换)、DTW(动态时间规整)算法，从

而实现语音识别系统的开发;

4、熟练使用CCS5000集成开过程。

5、发环境完成对程序的调试

二、设计内容：

语音识别（Speech Recognition）主要是指让机器听懂人说的话，即在各种情况下，准确地识别语音的内容，从而根据其信息，执行人的各种意图或执行特定的任务，其最终目标是实现人与机器进行自然语言通信。5402DSP是整个硬件系统的信号处理中心，完成了语音数据的获得、语音特征向量的提取和语音识别功能。本实验要求用TMS320C5402进行语音识别，使用CODEC(编译码器)对外部输入数据进行采集，DSP对语音信号进行保存和识别后再由CODEC口输出。本次实验所需达到的目标是：能够识别特定人所说的特定字，若符合，则显示识别结果，并输出相应的字。

三、实验原理：

语音识别原理方框图如下图所示：

各模块工作原理为：

（一）CODEC模块

CODEC模块以TLC320AD50为核心，其内部集成了16位A/D 和D/A转换器，采样速率最高可达22.05KHZ, 并可通过外部编程进行设置。在TLC320AD50C内部DAC之前有插值滤波器，而在ADC 之后有抽样滤波器，接受和发送可以同时进行。它采用两组模拟输入和两组模拟输出，有足够的共模抑制能力，可工作在差分或单端方式。输入增益和输出衰减可以通过外部编程控制。

AD50芯片使用差分输入、单端输出方式，这就需要将音频信号转换成差分信号，采用TLC2272低噪声的运算放大器实现转换功能。最后，AD50单端输出信号经音频功率放大器LM386放大后输出。CODEC内部电路如下图所示：

（二）Flash 存储器

DSK 提供了一个256K ×16bit 字的低电平flash 存储器。FLASH 可用于DSP 的数据和程序存储空间。

模拟输入模拟输出

（三）语音信号识别模块

语音信号中含有丰富的信息，如何从中提取出对语音识别有用的

TLC2272

LM386 TLC

320AD 50

TMS 320C 5402

SRAM

FLASH ROM