当前位置：文档之家› 基于ISD4004芯片的语音录放系统设计论文

基于ISD4004芯片的语音录放系统设计论文

ANYANG INSTITUTE OF TECHNOLOGY

本科毕业论文

基于ISD4004芯片的语音录放系统设计The Design of V oice Recording and Playback System Based on

ISD4004

系（院）名称：计算机科学与信息工程学院

专业班级：11届网络工程

学生姓名：张红红

学生学号：200703050017

指导教师姓名：曹领

指导教师职称：讲师

2011年5月

毕业设计（论文）原创性声明和使用授权说明

原创性声明

本人郑重承诺：所呈交的毕业设计（论文），是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知，除文中特别加以标注和致谢的地方外，不包含其他人或组织已经发表或公布过的研究成果，也不包含我为获得安阳工学院及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体，均已在文中作了明确的说明并表示了谢意。

作者签名：日期：

指导教师签名：日期：

使用授权说明

本人完全了解安阳工学院关于收集、保存、使用毕业设计（论文）的规定，即：按照学校要求提交毕业设计（论文）的印刷本和电子版本；学校有权保存毕业设计（论文）的印刷本和电子版，并提供目录检索与阅览服务；学校可以采用影印、缩印、数字化或其它复制手段保存论文；在不以赢利为目的前提下，学校可以公布论文的部分或全部内容。

作者签名：日期：

基于ISD4004芯片的语音录放系统设计

摘要：用单片机控制语音芯片，再把单片机和语音芯片嵌入到通信设备，智能仪器，治安报警及儿童玩具中，就可做成语音播放的机器。

本文介绍了基于AT89C52单片机及ISD4004语音板为主要部件的语音录放电路的工作原理、硬件和软件的设计。ISD4004系列工作电压3V,单片录放时间8至16分钟,音质好,适用于移动电话及其他便携式电子产品中。芯片设计是基于所有操作必须由微控制器控制,操作命令可通过串行通信接口SPI送入。论文概述了语音录放电路的原理，并且在介绍语音录放系统功能的基础上，提出了系统的总体构成。针对录放系统的录音、放音部分的总体设计方案进行了论证。进一步介绍了单片机AT89C52应用在系统中的应用，分析了系统各部分的硬件及软件实现。

本次设计目是完成一个简单方便，能可靠稳定工作的语音录放系统，该方案结构简单,控制可靠, 便于推广。

关键词：ISD4004 AT89C52单片机语音录放

The design of voice recording and playback system based on isd4004 Abstract：With the single-chip microcomputer control, and then make the pronunciation chip microcontroller and pronunciation chip embedded in communication equipment, intelligent instruments, security alarm and children's toys, so can make a speech broadcast machine.

This paper introduces ISD4004 based on AT89C52 single chip computer and of the main parts of speech plate as the working principle of voice recording circuit and the design of hardware and software. ISD4004 series working voltage, monolithic 3V recording time 8 to 16 minutes, timbre, suitable for mobile phones and other portable electronics. Chip design is based on all the operation must by micro controller control, operation orders through serial communication interface SPI into. This paper summarizes the principle of voice recording circuit, and introduces the function of speech on the basis of recording system, puts forward the general structure of the system. Recording system for the recording, playback part of the overall design scheme is demonstrated. This paper introduces microcontroller AT89C52 single applications in system, the application system were analyzed each part of hardware and software realization.

This design is to complete a reliable and stable working voice recording circuit. The design is simple in structure, reliable control and facilitate promotion.

Keywords: ISD4004；89C52microcontroller；voice recording and playback

引言 (1)

第1章绪论 (2)

1.1系统设计的意义 (2)

1.2系统设计的目的 (2)

1.3系统采用的实现方法 (3)

第2章单片机控制技术和开发环境介绍 (4)

2.189C52单片机性能和引脚介绍 (4)

2.1.1概述 (4)

2.1.2 AT89C52主要性能参数 (4)

2.1.3引脚功能说明 (4)

2.2 KEIL开发环境和建立工程 (8)

2.2.1 keil简介 (8)

2.2.2 Keil工程建立 (8)

2.3ISD4004介绍 (11)

2.3.1性能简述和引脚图 (11)

2.3.2引脚描述 (11)

2.4SPI(串行外设接口) (13)

2.4.1协议介绍 (13)

2.4.2 信息快进 (14)

2.4.3上电顺序 (14)

2.4.4 SPI端口的控制位 (15)

2.4.5 SPI控制寄存器 (16)

2.4.6时序 (16)

第3章系统总体设计 (18)

3.1硬件电路设计 (18)

3.1.1硬件电路图 (18)

3.1.2 ISD4004原理图 (18)

3.2软件设计 (19)

3.2.1语音芯片的内部信息寻址机制 (19)

3.2.2监控ISD4004录音地址的实例 (20)

3.2.3程序流程图 (21)

第4章测试实例 (23)

4.1测试内容 (23)

4.2测试结果 (23)

4.3基于ISD4004的家庭语音报警系统设计 (23)

4.3.1语音录放模块设计 (24)

4.3.2系统软件设计 (25)

4.4基于ISD4004的红外遥控医院语音播报系统的设计 (26)

4.4.1系统的硬件设计........................................................................... 错误！未定义书签。

4.4.2系统原理电路设计 (27)

4.4.3语音录放模块 (28)

结论 (29)

致谢 (30)

参考文献 (31)

引言

语音，作为一种典型的非平稳随机信号，是人类交流信息最自然、最有效、最方便的手段，在人类文明和社会进步中起着重要的作用。随着电子通信业的出现和计算机技术的发展，人们开始可以从数字信号处理的角度了解语音。语音信号的研究可以从时域和频域两个方面进行。其中时域的分析处理有两种方法：一是进行语音信号分析，这属于小型处理的范畴，主要是通过信号的加减、时移、倍乘、卷积、求相关函数等来实现；另一种是生成和变换成各种调制信号，这属于非线性的范畴，主要是对信号平均累加器的动态范围进行压缩扩张，用门限方法对噪声的抑制。对频域分析处理，即对信号的频率特性在频谱中加以分析研究，这拓展了信号分析的范围，是对不确定信号分析的主要方法。

随着计算机技术处理和信息技术的发展，语音交互已经成为人机交互的必要手段，而语音信号的采集处理是人机交互的前提和基础。声卡是计算机对语音信息进行加工的重要部件，它具有对信号滤波、放大、采样保持、A/D和D/A转换等功能。

语音信号处理作为一个重要的研究领域，已经有很长的研究历史。但是它的快速发展可以说是从1940年前后Dudley的声码器和Potter等人的可见语音开始的；20世纪60年代中期形成的一系列数字信号处理方法和技术，如数字滤波器、快速傅里叶变换等成为语音信号数字处理的理论和技术基础；到了80年代，由于矢量量化、隐马尔克夫模型和人工神经网络等相继被应用于语音信号处理，并经过不断改进与完善，使得语音信号处理技术产生了突破性的进展。进入90年代以来，语音信号处理在实用化方面取得了许多实质性的进展。一方面，对声音语音学统计模型的研究逐渐深入，鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为研究的热点。另一方面，为了语音识别使用化的需要，讲着自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题备受关注。

第1章绪论

1.1系统设计的意义

语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具，而且也是人与机器之间进行通信的重要工具。1874年电话的发展可以认为是现代处理的开端。电话的理论基础是尽可能不失真地传送语音波形。这种“波形原则”几乎统治了其后整整一百年。1939年产生了一种概念全新的语音处理技术，这就是著名的通道声码器技术。声码器的理论基础是认为语音是由人的声带振动产生的生源（载波）受到运动的声道的控制（调制）而产生的，因而将载波和调制两部分分开来进行传送便可极大地压缩频带。这一概念已经包含着其后出现的语音参数模型的基本思想。40年代后期，研制成功了能够把语音信号的时变谱用语音表示出来的仪器——语音仪，为语音信号分析提供了一个有力的工具。

对于语音信号，数字处理比模拟处理具有更多的优点。这是因为：第一，数字技术能够完成许多很复杂的信号处理工作；第二，通过语音进行交换的信息本质上具有离散的性质，因为语音可以看成是因素的组合，这就特别适合于数字处理；第三，数字系统具有高可靠性、价廉、紧凑、快速等特点，很容易完成实时处理任务；第四，数字语音适合于在强干扰通信中传输，易于和数据一起在通信网中传输，也易于进行加密传输。因此数字语音信号处理是主要研究方向。

无论是人与人之间还是人与计算机之间的语音通信，语音处理，特别是语音数字处理的理论和技术，具有特别重要的作用。

单片机的应用无处不在，利用单片机控制语音的录放也多不胜举。用单片机控制语音芯片，再把单片机和语音芯片嵌入到通信设备，智能仪器，治安报警及儿童玩具中，就可做成语音播放的机器，应用范围广泛。用单片机控制语音芯片设计语音录放系统,该系统功能多，录放音音质好，外围电路简单。

1.2系统设计的目的

设计一个语音录放系统，可以应用于通讯设备、智能仪表、治安报亭、语音报站、报数报价、语音讲解、语音记录、语音复读、教学仪器、智能玩具、电子礼品等领域。要求放音质量好，用二极管显示工作状态。系统具有较强的抗干扰能力，便于安装和扩展。

1.3系统采用的实现方法

设计硬件原理图,焊接语音模块,包括电压转换芯片,音频小功率放大器和ISD4004的连接.

编写软件程序,利用单片机控制技术,实现录、放、停等操作。

第2章单片机控制技术和开发环境介绍

2.1 89C52单片机性能和引脚介绍

2.1.1概述

AT89C52是美国ATMEL公司生产的低电压，高性能CMOS8位单片机，片内含8k bytes 的可反复擦写的只读程序存储器（PEROM）和256 bytes的随即存储数据存储（RAM），器件采用ATMEL公司的高密度，非易失性存储技术生产，与标准MCS-51指令系统及8052产品引脚兼容，片内置通用8位中央处理器和FLASH存储单元。功能强大AT89C52单片机适合与许多较为复杂控制应用场合。

AT89C52提供以下标准功能：8k字节FLASH闪速存储器，256字节内部RAM,32个I/O 口线，3个16位定时/计数器，一个6向量两级中断结构，一个全双工串行通信口，片内震荡器及时钟电路。同时，AT89C52可降至OHZ的静态逻辑操作，并支持两种软件可选的节点工作模式。空闲方式停止CPU工作，但允许RAM，定时/计数器，串行口及中断系统继续工作。掉电方式保存RAM中的内容，但震荡器停止工作并禁止其他所有部件工作直到下一个部件复位。

2.1.2 AT89C52主要性能参数

AT89C52单片机与MCS-51产品指令和引脚兼容，内部含有8K字节可擦写FALSH闪存，1000次擦写周期。同时具有全静态操作：OHZ-24MHZ，三级加密程序存储器，256×8字节内部RAM，32个可编程I/O口线，3个15位定时/计数器，8个中断源，可编程串行UART 通道的功能部件。

2.1.3引脚功能说明

引脚图如图2.1所示：

图2.1 AT89C52单片机引脚图

功能说明如下：

1 VCC：电源电压

2 GND：地

3 P0 口：P0 口是一组8 位漏极开路型双向I/O 口，也即地址/数据总线复用口。作为输出口用时，每位能吸收电流的方式驱动8个TTL逻辑门电路，对端口P0 写“1”时，可作为高阻抗输入端用。在访问外部数据存储器或程序存储器时，这组口线分时转换地址（低8 位）和数据总线复用，在访问期间激活内部上拉电阻。在Flash 编程时，P0 口接收指令字节，而在程序校验时，输出指令字节，校验时，要求外接上拉电阻。

4 P1 口：P1 是一个带内部上拉电阻的8 位双向I/O 口， P1 的输出缓冲级可驱动

（吸收或输出电流）4个TTL 逻辑门电路。对端口写“1”，通过内部的上拉电阻把端口拉到高电平，此时可作输入口。作输入口使用时，因为内部存在上拉电阻，某个引脚被外部信号拉低时会输出一个电流(IIL)。与AT89C51 不同之处是，P1.0 和P1.1 还可分别作为定时/计数器2 的外部计数输入（P1.0/T2）和输入（P1.1/T2EX），参见表2.1。Flash 编程和程序校验期间，P1 接收低8 位地址。

表2.1 P1.0和P1.1的第二功能

引脚号功能特性

P1.0 T2（定时/计数器2外部计数脉冲输入），时钟输出

P1.1 T2EX(定时/计数2捕获、重装载触发和方向控制）

5 P2 口：P2 是一个带有内部上拉电阻的8 位双向I/O 口，P2 的输出缓冲级可驱动（吸收或输出电流）4 个TTL 逻辑门电路。对端口P2 写“1”，通过内部的上拉电阻把端口拉到高电平，此时可作输入口，作输入口使用时，因为内部存在上拉电阻，某个引脚被外部信号拉低时会输出一个电流(IIL)。在访问外部程序存储器或1

6 位地址的外部数据存储器（例如执行MOVX @DPTR 指令）时，P2 口送出高8 位地址数据。在访问8 位地址的外部数据存储器（如执行MOVX @RI 指令）时，P2 口输出P2 锁存器的内容。Flash 编程或校验时，P2亦接收高位地址和一些控制信号。

6 P3口：P3口是一组带有内部上拉电阻的8位双向I/O 口。P3 口输出缓冲级可驱动（吸收或输出电流）4 个TTL 逻辑门电路。对P3口写入“1”时，它们被内部上拉电阻拉高并可作为输入端口。此时，被外部拉低的P3 口将用上拉电阻输出电流（IIL）。P3 口除了作为一般的I/O 口线外，更重要的用途是它的第二功能，如表2.2所示，此外，P3 口还接收一些用于Flash 闪速存储器编程和程序校验的控制信号。

表2.2 P3口第二功能

7 RST：复位输入。当振荡器工作时，RST引脚出现两个机器周期以上高电平将使单片机复位。

8 ALE/PROG：当访问外部程序存储器或数据存储器时，ALE（地址锁存允许）输出脉冲用于锁存地址的低8 位字节。一般情况下，ALE 仍以时钟振荡频率的1/6 输出固定的脉冲信号，因此它可对外输出时钟或用于定时目的。要注意的是：每当访问外部数据存储器时将跳过一个ALE 脉冲。对Flash 存储器编程期间，该引脚还用于输入编程脉冲（PROG）。如有必要，可通过对特殊功能寄存器（SFR）区中的8EH 单元的D0 位置位，可禁止ALE 操作。该位置位后，只有一条MOVX 和MOVC指令才能将ALE 激活。此外，该引脚会被微弱拉高，单片机执行外部程序时，应设置ALE 禁止位无效。

9 PSEN：程序储存允许（PSEN）输出是外部程序存储器的读选通信号，当AT89C52 由外部程序存储器取指令（或数据）时，每个机器周期两次PSEN 有效，即输出两个脉冲。在此期间，当访问外部数据存储器，将跳过两次PSEN信号。

·EA/VPP：外部访问允许。欲使CPU 仅访问外部程序存储器（地址为0000H—FFFFH），EA 端必须保持低电平（接地）。需注意的是：如果加密位LB1 被编程，复位时内部会锁存EA端状态。如EA端为高电平（接Vcc端），CPU 则执行内部程序存储器中的指令。Flash 存储器编程时，该引脚加上+12V 的编程允许电源Vpp，当然这必须是该器件是使用12V 编程电压Vpp。

·XTAL1：振荡器反相放大器的及内部时钟发生器的输入端。

·XTAL2：振荡器反相放大器的输出端。

2.2 keil开发环境和建立工程

2.2.1 keil简介

Keil C51是美国Keil Software公司出品的51系列兼容单片机C语言软件开发系统，与汇编相比，C语言在功能上、结构性、可读性、可维护性上有明显的优势，因而易学易用。Keil C51软件提供丰富的库函数和功能强大的集成开发调试工具，全Windows

界面。另外重要的一点，只要看一下编译后生成的汇编代码，就能体会到Keil C51

生成的目标代码效率非常之高，多数语句生成的汇编代码很紧凑，容易理解。

2.2.2 Keil工程建立

启动uVison3，点击“File New…”在工程管理器的右侧打开一个新的文件输入窗口，在这个窗口里输入一个源程序，注意大小写及每行后的分号，不要错输及漏输。

输入完毕之后，选择“File Save”，给这个文件取名保存，取名字的时候必须要加上扩展名，一般C语言程序均以“.C”为扩展名，这里将其命名为fgf.c，保存完毕后可以将该文件关闭。Keil不能直接对单个的C语言源程序进行处理，还必须选择单片机型号；确定编译、汇编、连接的参数；指定调试的方式；而且一些项目中往往有多个文件，为管理和使用方便，Keil使用工程（Project）这一概念，将这些参数设置和所需的所有文件都加在一个工程中，只能对工程而不能对单一的源程序进行编译和连接等操作。

点击“Project->New Project…”菜单，出现对话框，要求给将要建立的工程起一个名字，这里起名为fgf，不需要输入扩展名。点击“保存”按钮，出现第二个对话框，如图2.2所示，这个对话框要求选择目标CPU（即你所用芯片的型号），Keil支持的CPU很多，这里选择Atmel公司的89S52芯片。点击ATMEL前面的“+”号，展开该层，点击其中的89S52，然后再点击“确定”按钮，回到主窗口，此时，在工程窗口的文件页中，出现了“Targ et 1”，前面有“+”号，点击“+”号展开，可以看到下一层的“Source Group1”，这时的工程还是一个空的工程，里面什么文件也没有，需要手动把刚才编写好的源程序加入，点击“Source Group1”使其反白显示，然后，点击鼠标右键，出现一个下拉菜单，如图2.3所示，选中其中的“Add file to Group Source Group1”，出现一个对话框，要求寻找源文件。

图2.2 选择单片机型号

图2.3 加入文件

双击fgf.c文件，将文件加入项目，注意，在文件加入项目后，该对话框并不消失，等待继续加入其它文件，但初学时常会误认为操作没有成功而再次双击同一文件，这时会出现如图2.4所示的对话框，提示你所选文件已在列表中，此时应点击“确定”，返回前一对话框，然后点击“Close”即可返回主接口，返回后，点击“Source Group 1”前的加号，fgf.c 文件已在其中。双击文件名，即打开该源程序。

图2.4 重复加入源程序得到的提示

2.3 ISD4004介绍

2.3.1性能简述和引脚图

ISD4004 系列工作电压3V,单片录放时间8至16 分钟,音质好,适用于移动电话及其他便携式电子产品中。芯片采用C MOS 技术,内含振荡器、防混淆滤波器、平滑滤波器、音频放大器、自动静噪及高密度多电平闪烁存贮陈列。芯片设计是基于所有操作必须由微控制器控制,操作命令可通过串行通信接口SPI送入。芯片采用多电平直接模拟量存储技术, 每个采样值直接存贮在片内闪烁存贮器中,因此能够非常真实、自然地再现语音、音乐、音调和效果声,避免了一般固体录音电路因量化和压缩造成的量化噪声和"金属声"。采样频率可为4.0,5.3,6.4,8.0kHz,频率越低,录放时间越长,而音质则有所下降,片内信息存于闪烁存贮器中,可在断电情况下保存100 年(典型值),反复录音10 万次。

图2.5 ISD4004引脚图

2.3.2引脚描述

1 电源:(VCCA,VCCD) 为使噪声最小,芯片的模拟和数字电路使用不同的电源总线,并且分别引到外封装的不同管脚上,模拟和数字电源端最好分别走线,尽可能在靠近供电端处相连,而去耦电容应尽量靠近器件。

2 地线:(VSSA,VSSD) 芯片内部的模拟和数字电路也使用不同的地线。

3 同相模拟输入(ANA IN+) 这是录音信号的同相输入端。输入放大器可用单端或差分驱动。单端输入时, 信号由耦合电容输入,最大幅度为峰峰值 32mV,耦合电容和本端的3KΩ电阻输入阻抗决定了芯片频带的低端截止频率。差分驱动时,信号最大幅度为峰峰值16mV，为 ISD33000 系列相同。

4 反相模拟输入(ANA IN-) 差分驱动时,这是录音信号的反相输入端。信号通过耦合电容输入,最大幅度为峰峰值 16mV音频输出(AUD OUT) 提供音频输出,可驱动 5KΩ的负载。

5 片选(SS) 此端为低,即向该 ISD4004 芯片发送指令，两条指令之间为高电平。

6 串行输入(MOSI) 此端为串行输入端，主控制器应在串行时钟上升沿之前半个周期将数据放到本端,供ISD输入。

7 串行输出(MISO) ISD 的串行输出端。ISD 未选中时,本端呈高阻态。

8 串行时钟(SCLK) ISD 的时钟输入端,由主控制器产生,用于同步 MOSI 和 MISO 的数据传输。数据在 SCLK上升沿锁存到 ISD,在下降沿移出 ISD。

9 中断(/INT) 本端为漏极开路输出。ISD 在任何操作(包括快进)中检测到 EOM 或OVF 时,本端变低并保持。中断状态在下一个 SPI 周期开始时清除。中断状态也可用RINT 指令读取。OVF 标志----指示 ISD 的录、放操作已到达存储器的未尾。EOM 标志----只在放音中检测到内部的 EOM 标志时,此状态位才置1。

10 行地址时钟(RAC) 漏极开路输出。每个 RAC 周期表示 ISD 存储器的操作进行了一行(ISD4004 系列中的存贮器共 2400 行)。该信号 175ms 保持高电平,低电平为25ms。快进模式下,RAC 的 218.75μs 是高电平,31.25μs 为低电平。

图2.6 时序

11 外部时钟(XCLK) 本端内部有下拉元件。芯片内部的采样时钟在出厂前已调校,误差在 +1%内。商业级芯片在整个温度和电压范围内, 频率变化在+2.25%内。工业级芯片

在整个温度和电压范围内,频率变化在-6/+4%内,此时建议使用稳压电源。若要求更高精度,可从本端输入外部时钟(如前表所列)。由于内部的防混淆及平滑滤波器已设定,故上述推荐的时钟频率不应改变。输入时钟的占空比无关紧要,因内部首先进行了分频。在不外接地时钟时,此端必须接地。

12 自动静噪(AMCAP) 当录音信号电平下降到内部设定的某一阈值以下时,自动静噪功能使信号衰弱,这样有助于养活无信号(静音)时的噪声。通常本端对地接 1mF 的电容,构成内部信号电平峰值检测电路的一部分。检出的峰值电平与内部设定的阈值作比较,决定自动静噪功能的翻转点。大信号时,自动静噪电路不衰减,静音时衰减 6dB。1mF 的电容也影响自动静噪电路对信号幅度的响应速度。本端接 VCCA 则禁止自动静噪。

2.4 SPI(串行外设接口)

2.4.1协议介绍

ISD4004工作于SPI串行接口。SPI 协议是一个同步串行数据传输协议,协议假定微控制器的S PI 移位寄存器在S CLK 的下降沿动作,因此对I SD4004 而言,在时钟止升沿锁存MOSI 引脚的数据,在下降沿将数据送至M ISO 引脚。协议的具体内容为：

1 所有串行数据传输开始于S S 下降沿。

2 SS 在传输期间必须保持为低电平,在两条指令之间则保持为高电平。

3 数据在时钟上升沿移入,在下降沿移出。

4 SS 变低,输入指令和地址后,ISD 才能开始录放操作。

5 指令格式是(8 位控制码)加(1

6 位地址码)。

6 ISD 的任何操作(含快进)如果遇到E OM 或O VF,则产生一个中断,该中断状态在下一个S PI 周期开始时被清除。

7 使用"读"指令使中断状态位移出I SD 的M ISO 引脚时,控制及地址数据也应同步从MOSI 端移入。因此要注意移入的数据是否与器件当前进行的操作兼容。当然,也允许在一个SPI 周期里,同时执行读状态和开始新的操作(即新移入的数据与器件当前的操作可以不兼容)。

8 所有操作在运行位(RUN)置1时开始,置0时结束。

9 所有指令都在S S 端上升沿开始执行。

2.4.2 信息快进

用户不必知道信息的确切地址,就能快进跳过一条信息。信息快进只用于放音模式。放音速度是正常的1600 倍,遇到E OM 后停止,然后内部地址计数器加1,指向下条信息的开始处。

2.4.3上电顺序

器件延时TPUD(8kHz 采样时,约为25 毫秒)后才能开始操作。因此,用户发完上电指令后,必须等待TPUD,才能发出一条操作指令。参见表2.3。

例如,从00 从处发音,应遵循如下时序:

1发P OWERUP 命令;

2等待T PUD(上电延时);

3 发地址值为00 的S ETPLAY 命令;

4 发P LAY 命令。器件会从此00 地址开始放音,当出现E OM 时,立即中断,停止放音。

如果从00 处录音,则按以下时序:

1 发P OWER UP 命令;

2 等待T PUD(上电延时);

3 发P OWER UP 命令;

4 等待2倍T PUD;

5 发地址值为00 的S ETREC 命令;

6 发R EC 命令。器件便从00 地址开始录音,一直到出现O VF(存贮器末尾)时,录音停止。

智能语音录放系统

语音录放系统设计报告系别：电气工程与自动化专业:xxxxx

摘要目前，语音合成、语音识别、语音存储和回放技术的应用越来越广泛，尽管利用一般的单片机测控系统中都有的硬件电路（如A/D、 D/A、存储器等）能完成语音信号的数字化处理，但是功能比较单一、且效果不是很好。本文采用单片机AT89C52与语音芯片ISD2560组成的语音存储系统，实现了语音的录取、循环回放。系统硬件电路简单，调试方便，性价比高，实用性强。关键词：语音录放系统；单片机AT89C52 ；ISD2560

第1章绪论 1.1导言目前基于单片微机的语音系统的应用越来越广泛，如电脑语音钟、语音型数字万用表、手机话费查询系统、排队机、监控系统语音报警以及公共汽车报站器等等。本文用单片机AT89C52和录放时间达60S的数码语音芯片 ISD2560设计了一套智能语音录放系统，实现了语音的分段录取、组合回放，通过软件的修改还可以实现整段录取，循环播放，而且不必使用专门的 ISD语音开发设备。 1.2数字语音录放系统的发展数字语音录放是指利用数字技术对语音信号进行采集、处理、并且在一定存储设备中进行存储，并可在需要时进行输出的过程。相对于模拟设备来说，数字设备易于集成、小型化、成本更低，同时更为稳定，且操作更为直接、方便，使得数字语音录放系统目前在各种领域中都得到了广泛的应用。例如监控环境中使用的语音采集系统；再如家庭或学校中使用的语音复读机等，都可看作是数字语音录放系统的典型应用。然而目前一般的数字语音录放系统中，对语音只是进行简单的采集、存储和播放；虽然可以较大程度上保证语音的保真度，但过多的语音数据会造成对大量存储设备的需求。对于大型系统，可通过采用大容量的硬盘、甚至大规模的磁盘阵列来解决；但是对于小型的设备，例如便携式的语音复读机，由于容量有限，则不能采用同样的方法。近年来，语音信号处理技术研究的突飞猛进，为数字语音录放系统提供了新的发展空间。对语音的采集、处理从以前简单的波形编码转变为进行参数编码、压缩，从而大大减少了存储数据。举例来说，原始语音一般都是采用8KHz抽样，16bits的线性PCM编码进行采集，在一般的系统中就直接将采集后的数据进行存储；而如果采

HX8088主流的语音芯片对比

HX8088主流的语音芯片方案一、简介语音播报，这个基本在任何行业都可能用得到，如：公交报站、仪器仪表播报语音信息等等。应用非常的广泛，大到轨道交通，小到家庭用的小家电。如果在现有的系统或者产品设备中增加语音播放的功能，无疑将提升产品的用户体验和价值，因为产品的原则就是对用户越简单越显而易见，越好。市面上的语音播报方案也是呈现多样化，下面我就具体的来一个分析和解剖。目前市面上主流的语音方案，基本上就是OTP芯片，就是但颗芯片完成控制和语音的存储，最著名的就是佑华的4位机。这种类型的芯片，语音播放生硬，并且语音固定不能修改，另外一个就是可修改。而我们的方案，就是单芯片解决，更换声音极其简单，并且成本低廉。比现有的方案都具有更高的性价比二、主流分析市面上主要的方案分为两种： 1、是掩膜类（MASK）、一次性（OTP）类的 (1)、它的特点是成本低廉[争对量大的情况]。因为这样的芯片必须要量大[10K级别的]才便宜，因为量小了，分摊下来，成本其实也不低。 (2)、语音存储的时间短，播放的音质差，并且不可重复的更换语音。因为它内部实现的方法是将语音文件压缩成WA V的文件，直接存储在芯片内部，这样就会导致语音被压缩的非常的厉害。 (3)、主流的还是“SOP8”、“SOP16”、“牛屎堆封装” 2、可替换声音文件的多次烧录的语音芯片 (1)、这个只在OTP芯片的基础上引入了多少烧录的技术，其原理还是和OTP的方式是一样的，这就不做详细的介绍 3、可替换声音文件的芯片方案HX8088 (2)、KT404A方案，支持MP3解码。引入了mp3这一项技术，就可以保证播放的音质 (3)、支持USB直接更换语音，可重复烧录语音。烧录次数可达10万次，同时也支持批量烧录，生产极其方便。 (4)、标准的SOP16封装。三、优势说明相比较市场的其他方案，我们的优势十分的明显 ?音质接近电脑的播放水准，声音清晰并且圆润 ?芯片采用的是MP3解码的方法，所以相比较传统的WA V的OTP方案，在音频压缩方面有着非常大的优势 ?HX8088支持外部的存储器扩展，用户根据需要的大小，进行贴心的选择 ?语音可以分类管理，支持循环播放，随机播放，一对一播放等等，十分灵活 ?HX8088支持USB直接更新语音，烧录次数超过10万次 ?HX8088出货为封装片，保证了良率，同时交期最多3天，对数量无任何要求

单片机语音录放系统设计电气原理图汇编源程序流程图.

单片机语音录放系统设计+电气原理图+汇编源程序+流程图单片机语音录放系统设计+电气原理图+汇编源程序+流程图第3章硬件电路部分设计3.1单片机的选择在设计中文章选择单片机AT89C52作为播放器的核心控制部件，原因是因为AT89C52的功能全部兼容MCS-51，并且还有程序加密等功能，相比而言更加实用。AT89C52单片机是美国ATMEL公司生产的低电压，高性能CMOS8位单片机，片内含8KB的可反复擦写的只读程序存储器和256字节的随机存取存储器，器件采用ATMEL公司的高密度、非易失性存储技术生产，与标准MCS-51指令系统及8051产品引脚兼容，片内置通用8位中央处理器（CPU）和Flash存储单元，其强大的功能更适合较为复杂的控制应用场合。其主要工作特性是：?片内程序存储器内含8KB的Flash程序存储器，可擦写寿命为1000次；?片内数据存储器内含256字节的RAM；?具有32根可编程I/O口线；?具有3个可编程定时器；?中断系统是具有8个中断源、6个中断矢量、2级优先权的结构；?串行口是具有一个全双工的可编程串行通信口；?具有一个数据指针DPTR；?低功耗工作模式有空闲模式和掉电模式；?具有可编程的3级程序锁定位；?AT89C52工作电源电压位5（1±0.2）V，且典型值为5V。?AT89C52最高工作频率为24MHZ，编程频率为3～24HZ，编程启动电流为1mA。 3.1.1 引脚排列及功能 AT89C52的引脚排列如图3.1所示：首先对于I/O口线做一介绍：?P0口—8位、漏极开路的双向I/O口。当使用片外存储器及外扩I/O口时，P0口作为低字节地址/数据复用线。在编程时，P0口可用于接收指令代码字节；在校验时，P0口可输出指令字节（须外加上拉电阻）。P0口也可做通用I/O口使用，但需加上拉电阻，变为准双向口。当作为普通输入时，应将输出锁存器置1。P0口可驱动8个TTL负载。?P1口—8位、准双向 I/O口，具有内部上拉电阻。P1口是为用户准备的I/O口双向口。在编程和校验时，可用做输入低8位地址。用做输入时，应先将输出锁存器置1。P1口可驱动4个TTL负载。?P2口—8位、准双向I/O口，具有内部上拉电阻。当使用片外存储器或外扩I/O口时，P2口输出高8位地址。在编程/校验时，P2口可接收高字节地址和某些控制信号。P2口也可做普通I/O口使用。用做输入时，应先将输出锁存器置1。P1口可驱动4个TTL负载。?P3口—8位、准双向I/O 口，具有内部上拉电阻。P3口可做普通I/O口使用。用做输入时，应先将输出锁存器置1。在编程/校验时，P3口接收某些控制信号。它可驱动4个TTL负载。图 3.1 AT89C52引脚排列图 3.1.2 编程与效验方式AT89C52的编程、校验、程序锁定位的编程和片擦除等操作与AT89C51相同只是地址空间为0000H～1FFFH。表3-1 AT89C52编程电标志顶端标志型号编程电压VPP=5V 编程电压原文请找腾讯3249114六,维~论'文'网 https://www.doczj.com/doc/c914433905.html, VPP=12VAT89C52 AT89C52 AT89C52 XXXX- 5 XXXX YYWW YYWWAT89C52的编程电压VPP为12V或5V，在产品封装的顶部印有编程电压标志，如表3.1所列： 3.2 晶振及复位电路设计单片机要想工作必须要在XTAL1和XTAL2端口加晶振电路，单片机工作速度也是由晶振电路决定的。典型的晶振电路如图3.2.1所示：在晶振电路中，电路中电容C3和C4对振荡频率有微调作用，通常的取值范围30±10pF；石英晶体选择6MHz或12MHz都可以。其结果只是机器周期时间不同，影响记数器的记数初值和运算

语音录放器电子课程设计

南华大学电气工程学院《电子技术课程设计》设计题目：___________ 语音录放器___________ 专业：________ 本11通信02班 _________ 学生姓名：______________ 王佳杰____________ 学号：__________ 20114400218 ________ 指导教师：____________ 王彦________________ 教研室主任：__________ 王彦________________

语音录放器电子课程设计《电子技术课程设计》任务书

2. 对课程设计成果的要求〔包括图表(或实物)等硬件要求〕： ■ ■■ ■ ■*?■ ■ ■ ■ HT?■ ■ H■ ■ W■■■ ■ ■ H!■ ■?*■ ■ ■ VI■ ■ H!■■■ ▼?■ ■ !R■ ■?T?■ ■ *■ ■ ■ ■ ■ ■ W■ ■ !n■ ■ m■ ■ *■ ■ ■H■ ■ BH!■ ■?■ ■■■ VI■ ■ H ■ ■?*■ ■ ■ ■■■ ■ ■ ■■■ ■?■ ■ H ■ ■ m■ ■ !T?■ ■ IV■■■*■■■ ■ ■ ■*!!■■■ H■ ■ ■!■!■■■ VI ■ ■ H■ ■?*?设计电路，安装调试或仿真，分析实验结果，并写出设计说明书，语言流畅简洁，文字不得少于3500字。要求图纸布局合理，符合工程要求，使用Protel软件绘出原理图(SCH和印制电路板(PCB), 器件的选择要有计算依据。 3. 主要参考文献: (1) 黄智伟.全国大学生电子设计竞赛技能训练[M].北京: 北京航空航天大学出版社，2007 (2) 黄智伟. 全国大学生电子设计竞赛制作实训[M].北京: 北京航空航天大学出版社，2007 (3) 黄智伟. 全国大学生电子设计竞赛系统设计[M].北京: 北京航空航天大学出版社，2006 (4) 黄智伟. 全国大学生电子设计竞赛电路设计[M].北京: 北京航空航天大学出版社，2006 (5) 黄智伟. 全国大学生电子设计竞赛常用电路模块制作[M].北京：北京航空航天大学出版社， 2010 (6) 黄智伟等?基于NI multisim 的电子电路计算机仿真设计与分析[M].北京：电子工业出版社, 2007 (7) 黄智伟.印制电路板(PCB设计技术与实践[M].北京：电子工业出版社，2009 (8) 高吉祥等.电子技术基础实验与课程设计[M].北京：电子工业出版社，2002 (9) 吴运昌.模拟集成电路原理与应用[M].广州：华南理工大学出版社，2001年 (10) 谭博学等.集成电路原理及应用[M].北京：电子工业出版社，2003 (11) 魏立军.CMOS 4000系列60种常用集成电路的应用[M].北京：人民邮电出版社，1993 (12) 杨宝清.实用电路手册[M].北京：机械工业出版社.2002 (13) 陈有卿.报警集成电路和报警器制作实例[M].人民邮电出版社1996 (14) 肖景和.红外线热释电与超声波遥控电路[M].人民邮电出版社.2003 4. 课程设计工作进度计划:

语音识别芯片介绍

WT7010语音识别芯片 1.WT7010语音识别芯片概述 WT7010语音芯片内建8bit DSP核心,它能提供高分辨率ADC模拟采样和高质量的差分音频输入及麦克风输入,配备数学处理器以精确处理高压缩语音编解码或语音识别。该芯片有NAND接口和SPI总线用于外部存储器,提供2线串口用于连接其它设备或MCU。语音输入方面配备差分放大器用以麦克风输入以及AGC（自动增益控制）以便提供更好的SNR （信噪比）语音信号输入。芯片不单止嵌入前置放大也提供高品质的DAC和AB类扬声器放大器可以驱动输出高品质的声音。 2. WT7010功能特性 (1)内置8bitDSP核心,内部操作频率最高达48MHz（典型值：40MHz）； (2)内置麦克风差分前置放大器,包括AGC功能,16级增益控制功能； (3)最长可记录10秒语音； (4)内置8欧姆/0.5瓦电路,可直接驱喇叭或蜂鸣器,拥有16级音量控制,PWM音频输出方式； (5)低电压复位功能（LVR）； (6)内建看门狗（WDT）； (7)具有24 I/O； (8)内建有NAND-Flash接口及SPI主从总线接口； (9)数字部分工作电压：2.4V ~ 3.6V；模拟部分工作电压2.4V~4.5V； (10)休眠电流<3.0uA WT7010语音识别芯片为广州唯创新研发特定语音识别芯片,还有未尽的各项其他功能正在加紧研发中,有需求时可接受定制。 3. 应用举例在语音ic应用范围上,特定语音识别可以做简短语音识别系统,体现个性化服务,如: ? 语音电子锁； ? 智能家居开关,如WT系列智能语音识别开关； ? 特定报警器、家庭防盗报警器； ? 高级玩具,如鹦鹉学舌、TOM汤姆猫 4. 应用电路示例 (1)特定人语音识别（学习型）特定人语音识别（学习型）,是指预先对说话人进行语音输入,由语音识别芯片进行特征提取,然后进行存储。当语音输入时,语音芯片会将输入的声音特征和参考模块库内的特征进行匹配,匹配成功则输出成功值。 (a)示例电路

常用的语音芯片

支持winbond华邦ISD全系列语音芯片1700，ISD1720，ISD1730,ISD1740,ISD1750,ISD1760,ISD1790,ISD17120,ISD17150,ISD17180,ISD17210,ISD17240 等特点：使用界面简单，LCD显示地址信息，操作过程。精确地址拷贝。一次拷贝2片，5个采样频率选择。制作母片、录制芯片、拷贝芯片、测试芯片一机完成。可定制一些特殊拷贝功能、更改语音段地址等个性化服务。可作为，通过电脑对ISD1700编程；可作为ISD1700的拷贝机，通过ISD1700母片拷贝芯片，地址准确无误。 PM50 (13,20,50,100秒) 可分段分类有16脚和28脚芯片 PM60 (125,250,500,1000,2000,4000秒芯片) 28脚，长时间录放芯片， ISD1110P 10秒语音录放可分段 DIP-28封装 ISD1110COB 10秒语音录放 COB-28封装 ISD1820P 20秒语音录放 DIP-14封装 ISD2560P 60秒语音录放可公段 DIP-28封装（已经停产，可用ISD1760代替，《点击资料》） ISD1720P 20秒语音录放可分段 DIP-28封装带背景噪音处理 ISD1730S 30秒语音录放可分段 SOP-28封装带背景噪音处理 ISD1730P 30秒语音录放可分段 DIP-28封装带背景噪音处理 ISD1760P 60秒语音录放可分段 DIP-28封装带背景噪音处理 ISD1760S 60秒语音录放可分段 SOP-28封装带背景噪音处理 ISD1790P 90秒语音录放可分段 DIP-28封装带背景噪音处理 ISD1790S 90秒语音录放可分段 SOP-28封装带背景噪音处理 ISD4002-120P 120秒语音录放可分段 DIP-28封装 ISD4002-120S 120秒语音录放可分段 SOP-28封装 ISD4002-240P 240秒语音录放可分段 DIP-28封装 ISD4003-04MP 240秒语音录放可分段 DIP-28封装 ISD4003-04MS 240秒语音录放可分段 SOP-28封装 ISD4004-08MP 480秒语音录放可分段 DIP-28封装 ISD4004-08MS 480秒语音录放可分段 SOP-28封装 ISD4004-16MP 960秒语音录放可分段 DIP-28封装 ISD4004-16MS 960秒语音录放可分段 SOP-28封装

基于单片机的语音识别系统毕业设计

基于单片机的语音识别系统毕业设计目录摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

语音播报器的设计

语音播报器的设计 1 总体设计方案为了实现语音播报所需的功能，即按下开始键，启动录音，松开开始键，结束录音。结束录音后，循环播放所录音。而且为了使语音播报器的音质好, 功能强, 实验运行效果较好，使用起来也很简单。。所以本设计采用的设计框图如图1 所示：由上面的框图可知：本设计框图包括，按键，单片机，语音芯片，话筒和扬声器。其中单片机为本设计的控制核心，它控制语音芯片，实现对声音的存储和播放。语音芯片实现对语音的录入和播放。 1.1 微处理器的选择近年来，随着科学技术的发展，微型计算机技术日益发展，已经在许多领域得到了广泛的应用。随着集成电路工艺的发展，出现了单片机、DSP,ARM 等多种单片机。本系统采用AT89C51单片机。。AT89C51 是一种带4K 字节闪烁可编程可擦除只读存储器（FPEROM—Falsh Programmable and Erasable Read Only Memory）的低电压，高性能CMOS8 位微处理器，俗称单片机。该器件采用ATMEL 高密度非易失存储器制造技术制造，与工业标准的MCS-51 指令集和输出管脚相兼容。由于将多功能8 位CPU 和闪烁存储器组合在单个芯片中，ATMEL 的AT89C51 是一种高效微控制器，为很多嵌入式控制系统提供了一种灵活性高且价廉的方案[3]。51 单片机虽然和DSP,ARM 相比处理速度和运算速度上都比较慢，但它的体积小、质量轻、价格便宜，它的速度可以满足本次实验的要求，所以我们采用AT89C51 这款单片机。 1.2 语音芯片的选择目前市场流行的语音芯片有很多，从性价比的角度来考虑，美国ISD 公司的ISD 系列语音芯片可谓是一只独秀。ISD 系列语音芯片具有以下优点： ·采用模拟量数据存储在半导体存储器直接存储的专利技术，即将模拟量数据直接写入单个存储单元，不需要经过A/D，D/A 转换。 ·内部集成了大容量的的EEPROM，不再需要扩展存储器。 ·控制简单，控制引脚与TTL 电平兼容。 ·集成度高，使用方便。

课程设计--语音录放器

南华大学电气工程学院《电子技术课程设计》设计题目：语音录放器专业：本11通信02班学生姓名：王佳杰学号： 20114400218 指导教师:王彦教研室主任：王彦

《电子技术课程设计》任务书 1．课程设计的内容和要求（包括原始数据、技术要求、工作要求等）：一、课程设计内容题目：语音录放器要求：电源电压DC6~12V，利用语音录放芯片完成声音的录放。注：可以采用麦克风作为声音传感器，扬声器作为声音播放，ISD2560等语音芯片制作。二、课程设计要求 1.综合运用已学习过模拟电路和数字电路等知识，阅读相关集成电路芯片资料和相关文献，了解电子电路设计的有关知识，方法和特点，掌握基本的电子电路设计和芯片使用方法。 2.一人一题，所设计的电路必须制作成功，并且全部或者部分通过计算机仿真。课程设计必须自己独立完成，不得从网上下载，一经发现该课程成绩记零分。 3.课程设计设计说明书（报告）应包括有： ①电路工作原理分析 ②电路元器件参数设计计算 ③电路调试说明 ④电原理图和PCB图（必须自己画）

⑤元器件装配图（必须自己画） ⑥元器件清单 ⑦自己的收获和体会 ⑧要求字数不得少于3500字 ⑨要求图纸布局合理，符合工程要求，使用 Protel等软件绘制电原理图（SCH）、元器件布局图和印制电路板(PCB)。 4.所有的文档和表格必须采用Word形式。 5.同类型的设计题可以组成一个设计组，组员之间可以开展研究与讨论。雷同者均计0分。 6.阅读有关芯片英文参考资料，理解资料内容。 7.英文资料中的曲线、参数、方框图、引脚端封装等图（不包括电原理图和PCB图）可以直接采用（pdf 文档中的图可放大300倍后裁剪到Word文档中），图中的英文可以采用英文（中文）方式翻译在图下。 8.英文资料中的一些词，如果翻译拿不准，可以采用英文（中文）方式标注。 9.设计资料中的有关的公式可以直接采用。 10.课程设计结束，需要交制作的作品、文字稿和电子稿，采用Word文档形式。 11.成绩评定： ①按ABCDE分档，其中：优秀为A，良好为B，

ISD2560语音芯片的引脚及功能介绍

ＩＳＤ２５６０语音芯片的引脚及功能介绍ＩＳＤ２５６０是ＩＳＤ系列单片语音录放集成电路的一种。这是一种永久记忆型语音录放电路，录音时间为６０ｓ，可重复录放１０万次。该芯片采用多电平直接模拟量存储专利技术，每个采样值可直接存储在片内单个ＥＥＰＲＯＭ单元中，因此能够非常真实、自然地再现语音、音乐、音调和效果声，从而避免了一般固体录音电路因量化和压缩造成的量化噪声和“金属声”。该器件的采样频率为８．０ｋＨｚ，同一系列的产品采样频率越低录放时间越长但通频带和音质会有所降低。此外，ＩＳＤ２５６０还省去了Ａ／Ｄ和Ｄ／Ａ转换器。其集成度较高，内部包括前置放大器、内部时钟、定时器、采样时钟、滤波器、自动增益控制、逻辑控制、模拟收发器、解码器和４８０ｋ字节的ＥＥＰＲＯＭ。ＩＳＤ２５６０内部ＥＥＰＲＯＭ存储单元均匀分为６００行，有６００个地址单元，每个地址单元指向其中一行，每一个地址单元的地址分辨率为１００ｍｓ。此外，ＩＳＤ２５６０还具备微控制器所需的控制接口。通过操纵地址和控制线可完成不同的任务，以实现复杂的信息处理功能，如信息的组合、连接、设定固定的信息段和信息管理等。ＩＳＤ２５６０可不分段，也可按最小段长为单位来任意组合分段。１ＩＳＤ２５６０的引脚功能ＩＳＤ２５６０具有２８脚ＳＯＩＣ和２８脚ＰＤＩＰ两种封装形式。图１所示是其引脚排列。各引脚的主要功能如下：电源（ＶＣＣＡ，ＶＣＣＤ）：为了最大限度的减小噪声，芯片内部的模拟和数字电路使用不同的电源总线，并且分别引到外封装上。模拟和数字电源端最好分别走线，并应尽可能在靠近供电端处相连，而去耦电容则应尽量靠近芯片。地线（ＶＳＳＡ，ＶＳＳＤ）：由于芯片内部使用不同的模拟和数字地线，因此，这两脚最好通过低阻抗通路连接到地。节电控制（ＰＤ）：该端拉高可使芯片停止工作而进入节电状态。当芯片发生溢出即ＯＶＦ端输出低电平后，应将本端短暂变高以复位芯片；另外，ＰＤ端在模式６下还有特殊的用途。片选（ＣＥ）：该端变低且ＰＤ也为低电平时，允许进行录、放操作。芯片在该端的下降沿将锁存地址线和Ｐ／Ｒ端的状态；另外，它在模式６中也有特殊的意义。录放模式（Ｐ／Ｒ）：该端状态一般在ＣＥ的下降沿锁存。高电平选择放音，低电平选择录音。录音时，由地址端提供起始地址，直到录音持续到ＣＥ或ＰＤ变高，或内存溢出；如果是前一种情况，芯片将自动在录音结束处写入ＥＯＭ标志。放音时，由地址端提供起始地址，放音持续到ＥＯＭ标志。如果ＣＥ一直为

语音芯片分类

语音芯片分类前言: 可能很多用户还不了解语音技术现在发展的情况，认为语音的方案还是停留在曾经经典的VS1003系列芯片，以及早期的ISD芯片，可是技术发展这么多年，这些复杂并且昂贵的方案早就已经更新很多代了，推陈出新的是成本更低、性能更加优秀的方案，使用简单、成本低廉、稳定性高才是现在所追求的产品。目前市场上主流的分类如下： (1)、早期的台系OTP语音芯片这些都是曾经最为辉煌的语音芯片，用户数量最大，其中以台系的OTP语音芯片适用范围最为广，包括：汽车的报警器、安防防盗器、楼宇对讲、语音提示器等等，其中的芯片大多数也都是以4位机为主，量大，价格甚至可以做到5毛钱一下，市面上这样的方案依然很多厂家都在做 (2)、华邦推出的ISD系列芯片由于华邦的ISD系列芯片在学生这个群体推广得很好，所以市场的用量也是比较大的，但是其单价比较高，这些年也渐渐的被其他的芯片所替代。另外华邦也渐渐的不怎么推广这些芯片了，所以这个经典的系列也就成了明日黄花，知道的人多，用的人少。 (3)、VS10xx系列芯片谈到这个芯片，就不得不提经典的VS1003了，至今依然在教科书中见到，这个是曾经的辉煌，虽然厂家目前也推出了几款差不多，功能也相当强悍的芯片，但是知名度却远不如VS1003，这颗芯片在刚推出时，基本上是属于划时代的产品，让很多需要解码MP3的需求得以满足。 (4)、KT403A以及KT603A芯片相比较上述的方案，这两颗芯片无疑使性价比最高的，虽然音质方面比不上VS10xx系列芯片，但是至少接近了90%。另外还有一个最大的优点，就是价格不及VS10xx系列的一半。价格上面虽然比OTP的语音芯片贵，但是音质却比他们好上10倍，并且语音可以任意的更换和重复的烧录。控制方式也是极其的明了，大大减少了用户的开发周期。

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科，它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术，语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理语音识别系统本质上是一种模式识别系统，包括特征提取、模式匹配、参考模式库等三个基本单元，它的基本结构如下图所示：未知语音经过话筒变换成电信号后加在识别系统的输入端，首先经过预处理，再根据人的语音特点建立语音模型，对输入的语音信号进行分析，并抽取所需的特征，在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型，将计算机中存放的语音模板与输入的语音信号的特征进行比较，根据一定的搜索和匹配策略，找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义，通过查表就可以给出计算机的识别结果。显然，这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法目前具有代表性的语音识别方法主要有动态时间规整技术（DTW）、隐马尔可夫模型（HMM）、矢量量化（VQ）、人工神经网络（ANN）、支持向量机（SVM）等方法。动态时间规整算法（Dynamic Time Warping，DTW）是在非特定人语音识别中一种简单有效的方法，该算法基于动态规划的思想，解决了发音长短不一的模板匹配问题，是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时，就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度，按照某种距离测度得出两模板间的相似程度并选择最佳路径。隐马尔可夫模型（HMM）是语音信号处理中的一种统计模型，是由Markov链演变来的，所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本，且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出，因此是较理想的语音识别模型。矢量量化（Vector Quantization）是一种重要的信号压缩方法。与HMM相比，矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域，每个小区域寻找一个代表矢量，量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书，从实际效果出发寻找到好的失真测度定义公式，设计出最佳的矢量量化系统，用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中，人们还研究了多种降低复杂度的方法，包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。人工神经网络（ANN）是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

智能语音播报显示系统

智能语音播报、显示系统作者： 1、方栋学号 1062610315 2、许其亮学号 1062610323 3、任帅辉学号 1062510127 作品简介: 1、制作背景：随着智能化和机械化的发展，语音播报功能越来越受到大众的青睐，公交车、汽车、电动车、电话等得到了普及。但还有很多设备仍然不具有这种超便利的功能。为此我们设计了这款语音智能播报和选段显示系统，它可以应用于各种设备，小巧便利。 2、摘要：本系统以APR9600语音芯片为基础，采用52单片机系统控制，和数码管显示，实现语音智能播报和显示。调试与制作： 1、总体设计：想通过控制电路的方式来选择工作方式，然后语音经过话筒输入进入语音芯片，再有音频电路（功放）再经过扬声器输出。通过单片机程序的控制实现播报系统的智能化。 2、语音芯片的选取与电路设计：我们需要的是具有录放音功能的芯片，而且录音量不需要太大，但要可以录入足够多段。而且可以通过快进键来控制语音选段的播放。通过搜集资料我们选择了APR9600语音芯片。他有串行和并行两种模式，根据需要我们选择了串行模式。功能介绍：置 MSEL1、MSEL2 均为 0，在录音时S8 置 1。置RE 端为 0 为录音状态，按住M1 即开始录第一段，松键即停止。再按住S1 即录第二段，如此一直分段录音，直到芯片溢出。在放音时（RE=1）S8 置 0 为串行选段控制方式，按一下/M1 只能放音第一段，再按还是放音第一段。这时的S2 有效成为快进选段键，每按一下S2 即向后移动一段，例如现在按了三下S2，再按S1 就放音第四段。因此可以实现选段放音。按CE 键复位为第一段。具体电路设计：

主流的语音芯片对比

主流的语音芯片方案一、简介语音播报，这个基本在任何行业都可能用得到，如：公交报站、仪器仪表播报语音信息等等。应用非常的广泛，大到轨道交通，小到家庭用的小家电。如果在现有的系统或者产品设备中增加语音播放的功能，无疑将提升产品的用户体验和价值，因为产品的原则就是对用户越简单越显而易见，越好。市面上的语音播报方案也是呈现多样化，下面我就具体的来一个分析和解剖。目前市面上主流的语音方案，基本上就是OTP芯片，就是但颗芯片完成控制和语音的存储，最著名的就是佑华的4位机。这种类型的芯片，语音播放生硬，并且语音固定不能修改，另外一个就是可修改。而我们的方案，就是单芯片解决，更换声音极其简单，并且成本低廉。比现有的方案都具有更高的性价比二、主流分析市面上主要的方案分为两种： 1、是掩膜类（MASK）、一次性（OTP）类的 (1)、它的特点是成本低廉[争对量大的情况]。因为这样的芯片必须要量大[10K级别的]才便宜，因为量小了，分摊下来，成本其实也不低。 (2)、语音存储的时间短，播放的音质差，并且不可重复的更换语音。因为它内部实现的方法是将语音文件压缩成WA V的文件，直接存储在芯片内部，这样就会导致语音被压缩的非常的厉害。 (3)、主流的还是“SOP8”、“SOP16”、“牛屎堆封装” 2、可替换声音文件的多次烧录的语音芯片 (1)、这个只在OTP芯片的基础上引入了多少烧录的技术，其原理还是和OTP的方式是一样的，这就不做详细的介绍 3、可替换声音文件的芯片方案KT404A (2)、KT404A方案，支持MP3解码。引入了mp3这一项技术，就可以保证播放的音质 (3)、支持USB直接更换语音，可重复烧录语音。烧录次数可达10万次，同时也支持批量烧录，生产极其方便。 (4)、标准的SOP16封装。三、优势说明相比较市场的其他方案，我们的优势十分的明显 ?音质接近电脑的播放水准，声音清晰并且圆润 ?芯片采用的是MP3解码的方法，所以相比较传统的WA V的OTP方案，在音频压缩方面有着非常大的优势 ?KT404A支持外部的存储器扩展，用户根据需要的大小，进行贴心的选择 ?语音可以分类管理，支持循环播放，随机播放，一对一播放等等，十分灵活 ?KT404A支持USB直接更新语音，烧录次数超过10万次 ?KT404A出货为封装片，保证了良率，同时交期最多3天，对数量无任何要求

【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

摘要语音识别主要是让机器听懂人说的话，即在各种情况下，准确地识别出语音的内容，从而根据其信息执行人的各种意图。语音识别技术既是国际竞争的一项重要技术，也是每一个国家经济发展不可缺少的重要技术支撑。本文基于语音信号产生的数学模型，从时域、频域出发对语音信号进行分析，论述了语音识别的基本理论。在此基础上讨论了语音识别的五种算法：动态时间伸缩算法(Dynamic Time Warping，DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network，ANN)方法、隐马尔可夫(Hidden Markov Model，HMM)方法、HMM和ANN的混合模型。重点是从理论上研究隐马尔可夫(HMM)模型算法，对经典的HMM模型算法进行改进。语音识别算法有多种实现方案，本文采取的方法是利用Matlab强大的数学运算能力，实现孤立语音信号的识别。Matlab 是一款功能强大的数学软件，它附带大量的信号处理工具箱为信号分析研究，特别是文中主要探讨的声波分析研究带来极大便利。本文应用隐马尔科夫模型(HMM) 为识别算法，采用MFCC(MEL频率倒谱系数)为主要语音特征参数，建立了一个汉语数字语音识别系统，其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法；同时，提出利用Matlab图形用户界面开发环境设计语音识别系统界面，设计简单，使用方便，系统界面友好。经过统计，识别效果明显达到了预期目标。关键词：语音识别算法；HMM模型；Matlab；GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time

WT588C语音芯片技术详解说明

WT588C语音芯片技术详解说明 1、产品特点可以重复烧写语音； WT588C-16S容量可以选择4Mb、8Mb、16Mb、32Mb、64Mb、128Mb； PWM和DAC两种音频输出方式；内部集成时钟振荡器；二线最多可以加载255段语音；触发防抖时间：50us（串口）和10ms（按键）；支持播放不同采样率的语音文件、WAV音频格式；支持BUSY状态输出功能；工作电压：DC2.4～5.0V。 2、芯片选型 WT588C16-16S内置容量16Mbit，可以任意更换语音。 WT588C-16S外接SPI-flash，可以任意更换语音。芯片控制方式有：两线串口。芯片输出方式有：PWM输出(直接推动喇叭)、DAC输出(外接功放使用)。下文有相应的参考电路。 3、应用范围汽车（防盗报警器、倒车雷达、GPS导航仪、电子狗、中控锁）；智能家居系统；家庭防盗报警器；医疗器械人声提示；家电（电磁炉、电饭煲、微波炉）；娱乐设备（游戏机、游乐机）；学习模型（早教机、儿童有声读物）；智能交通设备（收费站、停车场）；通信设备（电话交换机、电话机）；工业控制领域（电梯、工业设备）；高级玩具。 4、管脚图 4.1、WT588C16-16S DO SPI-DO SPI-CS P02 P01 P03 P04 GND PWM1 PMW2 SPI-DI VDDS VDD SPI-CLK VDDL VDDS WT588C16-16S

4.2、WT588C-16S SPI-DI SPI-DO SPI-CS P02 P01 P03 P04 GND PWM1 PMW2 P05 P06 VDD SPI-CLK VDDL VDDS WT588C-16S

语音芯片详细介绍

语音芯片详细介绍语音芯片可以用作广告语提示、语音导航、语音报警等，NVB语音芯片成本低、性能稳定、音质高、控制方便、电路简单，能应用在血压计、考勤机、血糖仪、理疗器械、足浴盆、门铃提示器、语音玩具、汽车电子、小家电、念佛机、工艺礼品上等。 NVB系列语音芯片是广州九芯电子科技最新推出的一款适合工厂量产型的工业级OTP语音芯片。它具有成本低，性能稳定，音质高，控制方便，电路简单等诸多显著优点。NVB的推出，以近似于当前业界掩膜的价格，但无最小量的限制，弥补了目前产业界的一个不足，适合低成本快速投产，最快仅需一天即可出货。 NVB是一款性能稳定的语音芯片，无需任何外围电路，在极其恶劣的噪声环境下都可正常工作，它具有宽泛的耐温和耐压范围，正常工作范围宽达1.8V~4.5V，弥补了目前市面上语音芯片抗干扰能力较差的缺陷。 NVB系列语音芯片有一组PWM输出口，可以直推0.5w喇叭，音质清晰。内置LVR复位，无需外加复位电路。内置精确的内阻频率振动器（最大仅+-1%的误差），无需外接电阻。NVB一个很明显的优势是OTP烧录程式可以

和MASK掩膜无缝对接，也就是说，产品前期试产阶段用户可以OTP试产，试产成功后进入大规模生产时，可以直接按OTP样品投产MASK掩膜以降低成本，客户无需二次确认样品。 NVB系列语音芯片具有多种按键触发方式，且可以输出多种形式的电平信号，可以设定按语音的起伏节奏变化。另外NVB支持主控MCU二线串口控制，可以任意控制多段语音触发，是市面上唯一8脚芯片支持256段声音的语音芯片。 NVB系列语音芯片具有多种实用的封装形式：DIP8、SOP8等，外围电路仅需一电源耦合电容即可，工作稳定，宽泛的工作电压，超低的待机功耗以及宽耐温性能都使NVB系列语音芯片在广泛的应用领域中拥有一流的性价比优势。 2功能特点 OTP存储格式，生产周期快，最快仅需一天，下单无最小量限制；灵活的多种按键操作模式以及电平输出方式供选择（边沿按键触发、电平触发、随机按键播放、顺序按键播放）；简单方便的两线MCU串口控制方式，用户主控MCU可控制任意段语音的触发播放及停止；支持4个按键触发。语音时长20秒、40秒、65秒、80秒、115秒；内置一组PWM输出器可直推0.5W喇叭；灵活的放音操作，通过组合可节省语音空间，单个数据口最多可播放128个语音组合；音质优美，性能稳定，物美价廉；内置LVR自复位电路，保证芯片正常工作； DIP8，SOP8以及COB三种封装可供选择，使用方便，应用灵活；外围电路简单，仅需一耦合电容；工作电压范围：1.8V～4.5V（5V供电的话VDD需串接电容降压）；静态电流：2uA；

基于matlab的语音识别系统

机电信息工程学院专业综合课程设计系：信息与通信工程专业：通信工程班级：081班设计题目：基于matlab的语音识别系统学生姓名：指导教师：完成日期：2011年12月27日

一．设计任务及要求 1.1设计任务作为智能计算机研究的主导方向和人机语音通信的关键技术，语音识别技术一直受到各国科学界的广泛关注。以语音识别开发出的产品应用领域非常广泛，有声控电话交换、语音拨号系统、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、订票系统、声控智能玩具、医疗服务、银行服务、股票查询服务、计算机控制、工业控制、语音通信系统、军事监听、信息检索、应急服务、翻译系统等，几乎深入到社会的每个行业、每个方面，其应用和经济社会效益前景非常广泛。本次任务设计一个简单的语音识别系。 1.2设计要求要求：使用matlab软件编写语音识别程序二．算法方案选择 2.1设计方案语音识别属于模式识别范畴，它与人的认知过程一样，其过程分为训练和识别两个阶段。在训练阶段，语音识别系统对输入的语音信号进行学习。学习结束后，把学习内容组成语音模型库存储起来；在识别阶段，根据当前输入的待识别语音信号，在语音模型库中查找出相应的词义或语义。语音识别系统与常规模式识别系统一样包括特征提取、模式匹配、模型库等3个基本单元，它的基本结构如图1所示。图1 语音识别系统基本结构图本次设计主要是基于HMM模型（隐马尔可夫模型）。这是在20世纪80年代引入语音识别领域的一种语音识别算法。该算法通过对大量语音数据进行数据统计，建立识别词条的统计模型，然后从待识别语音信号中提取特征，与这些模

型进行匹配，通过比较匹配分数以获得识别结果。通过大量的语音，就能够获得一个稳健的统计模型，能够适应实际语音中的各种突发情况。并且，HMM算法具有良好的识别性能和抗噪性能。 2.2方案框图图2 HMM语音识别系统 2.3隐马尔可夫模型 HMM过程是一个双重随机过程：一重用于描述非平稳信号的短时平稳段的统计特征（信号的瞬态特征）；另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段，即短时统计特征的动态特性（隐含在观察序列中）。人的言语过程本质上也是一个双重随机过程，语音信号本身是一个可观测的时变列。可见，HMM合理地模仿了这一过程，是一种较为理想的语音信号模型。其初始状态概率向量π，状态转移概率矩阵向量A，以及概率输出向量B一起构成了HMM的3个特征参量。HMM 模型通常表示成λ={π，A，B}。 2.4HMM模型的三个基本问题 HMM模型的核心问题就是解决以下三个基本问题： (1)识别问题：在给定的观测序列O和模型λ=（A,B,π）的条件下，如何有效地计算λ产生观测序列O的条件概率P(O︱λ)最大。常用的算法是前后向算法，它可以使其计算量降低到N2T次运算。 (2)最佳状态链的确定：如何选择一个最佳状态序列Q=q1q2…qT，来解释观察序列O。常用的算法是Viterbi算法。 (3)模型参数优化问题：如何调整模型参数λ=(A,B,π)，使P(O︱λ)最大：这是三个问题中最难的一个，因为没有解析法可用来求解最大似然模型，所以只能使用迭代法(如Baum-Welch)或使用最佳梯度法。第一个问题是评估问题，即已知模型λ=(A,B,π)和一个观测序列O，如何计算由该模型λ产生出该观测序列O的概率，问题1的求解能够选择出与给定的观测序列最匹配的HMM模型。第二个问题力图揭露模型中隐藏着的部分，即找出“正确的”状态序列，这是一个典型的估计问题。

文档之家