基于AVR单片机的语音识别系统设计

发布者:MindfulYogi最新更新时间:2012-08-08 来源: 电子设计工程 关键字:AVR单片机  语音识别系统  LD3320 手机看文章 扫描二维码
随时随地手机看文章

0 引言
    传统的人机交互依靠复杂的键盘或按钮来实现,随着科技的发展,一些新型的人机交互方式也随之诞生,带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算量大,一般在计算机上实现,即使是嵌入式方面,多数方案也需要运算能力强的ARM或DSP,并且外扩RAM、FLASH等资源,增加了硬件成本,这些特点无疑限制了语音识别技术的应用,尤其是嵌入式领域。
    本系统采用的主控MCU为Atmel公司的ATMEGA128,语音识别功能则采用ICRoute公司的单芯片LD3320。LD3320内部集成优化过的语音识别算法,无需外部FLASH,RAM资源,可以很好地完成非特定人的语音识别任务。

1 整体方案设计
1.1 语音识别原理
    在计算机系统中,语音信号本身的不确定性、动态性和连续性是语音识别的难点。主流的语音识别技术是基于统计模式识别的基本理论,原理如图1所示。

a.JPG

     语音识别通常需要两个阶段完成。第一阶段是训练,主要是提取语音特征,用户往往需要进行几次语音训练,经过预处理和特征提取后获得相应特征参数。第二阶段是识别,识别过程就是将输入的语音特征参数和模型库中的参数进行相似性比较,最后输出匹配度最高的特征参数完成识别过程。

2 硬件电路设计
    硬件框架如图2所示,电路主要由主控制器电路和语音识别电路组成。ATMEGA128控制LD3320语音识别电路,输出结果由ATMEGA128处理,然后通过总线来控制不同的设备。

b.JPG

2.1 控制器电路
    控制器选用Atmel公司生产的ATMEGA128芯片,采用先进的RISC结构,内置128 KB FLASH,4 KB SRAM,4 KB E2PROM等丰富资源。该芯片
是业界高性能、低功耗的8位微处理器,并在8位单片机市场有着广泛应用。
2.2 LD3320语音识别电路
    LD3320芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路,包括A/D、D/A转换器、麦克风接口、声音输出接口等,而且可以播放MP3。不需要外接任何的辅助芯片如FLASH,RAM等,直接集成到产品中即可以实现语音识别、声控、人机对话功能。
    图3为LD3320电路原理图,与MCU通信采用SPI总线方式,时钟不能超过1.5MHz。[page]

c.JPG


    麦克风工作电路如图4所示,音频输出只需将扬声器连接到SPOP和SPON即可。使用SPI总线方式时,LD3320的MD要设为高电平,SPIS设为低电平。SPI总线的引脚有SDI,SDO,SDCK以及SCS。INTB为中断端口,当有识别结果或MP3数据不足时,会触发中断,通知MCU处理。RSTB引脚是LD3320复位端,低电平有效。LED1,LED2作为上电指示灯。

d.JPG

3 软件系统设计
    软件设计主要有两部分,分别为移植LD3320官方代码和编写语音识别应用程序。
3.1 移植LD3320源代码
    LD3320源代码是基于51单片机实现的,SPI部分采用的是软件模拟方式,但在播放MP3数据时会有停顿现象,原因是51单片机主频较低,导致SPI速率很慢,不能及时更新MP3数据。移植到ATMEGA128需要修改底层寄存器读写函数、中断函数等。底层驱动在Reg_RW.c文件中,首先在Reg_RW.h使用HARD_PARA_PORT宏定义,以支持硬件SPI。然后在Reg_RW.c文件中找到HARD_PARA_PORT对应条件宏的代码段,保留AVR的SPI接口代码。
3.2 应用程序实现
    在代码中预先设定几个单词:“你好”,“播放音乐”,“打开”。当用户说“播放音乐”时,MCU控制LD3320播放一段音乐,如果是其他词语,则在串口中打印识别结果,然后再次转换到语音识别状态。
3.2.1 MP3播放代码
    LD3320支持MP3数据播放,播放声音的操作顺序为:
    通用初始化→MP3播放用初始化→调节播放音量→开始播放。
    将MP3数据顺序放入数据寄存器,芯片播放完一定数量的数据时会发出中断请求,在中断函数中连续送入声音数据,直到声音数据结束。MP3播放函数实现代码如下:

e.JPG

    由于MCU容量限制,选取测试的MP3文件不能太大。首先在计算机上将MP3文件的二进制数据转为标准C数组格式文件,然后将该文件加入工程中。源代码中MP3文件存储在外扩的SPI FLASH中,工程中需要注释和移除全部相关代码。MP3数据读取函数是LD_ReloadMp3Data(),只需将读取的SPI FLASH数据部分改成以数组数据读取的方式即可。[page]
3.2.2 语音识别程序
    LD3320语音识别芯片完成的操作顺序为:通用初始化→ASR初始化→添加关键词→开启语音识别。在源代码中的RunASR()函数已经实现了上面的过程,直接调用即可开启语音识别功能。
    RunASR()函数代码如下:

f.JPG

    用户说完话后,LD3320通过打分的方式,将关键词列表中特征最相似的一个作为输出。然后LD3320会产生一个中断信号,此时MCU跳入中断函数读取C5寄存器的值,该值即为识别结果,得到结果后,用户可以根据数值来实现一些功能,比如读取到1,说明是“播放音乐”,那么可以调用前面的PlaySound()函数来播放音乐。

h.JPG

    语音识别控制的关键点在于语音识别的准确率。表1给出了测试结果,当然也可以在识别列表中加入更多的关键词来做测试。通过测试结果可以看出,LD3320的识别率在95%上,能够满足用户需求。

4 结语
    本文讨论了基于AVR单片机的语音识别系统设计的可行性,并给出了设计方案。通过多次测试结果表明,本系统具有电路运行稳定,语音识别率高,成本低等优点。同时借助于LD3320的MP3播放功能,该系统具有一定的交互性和娱乐性。移植性方面,系统通过简单的修改,可以很方便地将LD3320驱动程序移植到各种嵌入式系统中。随着人们对人工智能功能的需求,语音识别技术将越来越受到人们的关注,相信不久的将来,语音识别将会拥有更广阔的应用。

关键字:AVR单片机  语音识别系统  LD3320 引用地址:基于AVR单片机的语音识别系统设计

上一篇:基于AVR单片机的SPI多机环路通信
下一篇:AVR定时器的用法要点介绍

推荐阅读最新更新时间:2024-03-16 13:05

AVR单片机应用经验
AVR与传统类型的单片机相比,除了必须能实现原来的一些基本的功能,其在结构体系、功能部件、性能和可靠性等多方面有很大的提高和改善。   但使用更好的器件只是为设计实现一个好的系统创造了一个好的基础和可能性,如果还采用和沿袭以前传统的硬件和软件设计思想和方法的话,是不能用好AVR的,甚至也不能真正的了解AVR的特点和长处。   功能越好的器件,需要具备更高技术和能力的人来使用和驾驭它。就象一部好的F1赛车,只有具备高超技术的驾驶员才能充分体会到车的特点,并能最大限度的发挥出车的性能。   AVR具有上手入门快,开发方便简单的特点,但要充分体会和发挥AVR的优点,还需要应用工程师本身的硬软件设计开发能力的不断学习、实践提高。
[单片机]
嵌入式学习笔记17——AVR单片机之头文件简介和使用
1. ICCAVR的头文件形式为: #include io*v.h 芯片使用的不是mega类;或#include iom*v.h 使用的芯片为mega类。其中 * 用相应的芯片型号代替,如芯片ATmega8,则头文件为#include iom8v.h 2. 在AVR单片机的使用中有一个重要的头文件,macros.h,该头文件定义了一些常用的宏,如BIT(X),以及看门狗复位,开/关全局中断等等。 3. AVR单片机的位操作:AVR中没有像51单片机中sbit的用法,但是同样可对单个I/O口进行操作,其具体方法如下: DDRB | =(1 3); DDRB | =BIT(3); DDRB | =BIT(DDR
[单片机]
AVR单片机公交车语音报站系统程序
const char QFDZ ={ {0x10,0x10,0x17,0x15,0x95,0x75,0x57,0x10,0x10,0x13,0x30,0xD0,0x57,0x10,0x10,0x00, 0x00,0x00,0xFE,0x20,0x24,0x22,0xFC,0x00,0x00,0xF8,0x02,0x01,0xFE,0x00,0x00,0x00},//前 {0x10,0x10,0x10,0x10,0x10,0x10,0x9F,0x52,0x32,0x12,0x12,0x13,0x10,0x10,0x10,0x00, 0x02,0x02,0x04,0x08,0x30,0xC0,0x00,0x00,0x04,0x02,0
[单片机]
基于AVR单片机的12864液晶(ks0108)驱动程序及仿真
#include iom16v.h #include avrdef.h #define EN 0 #define RS 1 #define CS1 2 #define CS2 3 unsigned char yang ={ 0xEF,0xFB,0xEF,0xFC,0x2F,0xFF,0x00,0x00,0x6F,0xFF,0xEF,0xDC,0xFF,0xEF,0xBD,0x73, 0x1D,0xBC,0xAD,0xDF,0xB5,0xE7,0x39,0xB8,0xBD,0x7F,0xBF,0xBF,0x3F,0xC0,0xFF,0xFF }; unsigned char ying ={ 0
[单片机]
基于<font color='red'>AVR单片机</font>的12864液晶(ks0108)驱动程序及仿真
AVR单片机串口详解
一.熟悉AVR单片机UART资源,首先从波特率和帧说起 波特率:与51不同有单独的波特率发生器,不需要定时器来产生,节省了资源 波特率计算公式,这里我采用IccAVR的配置功能,直接计算生成 单片机支持的模式:异步正常模式,异步倍数模式,和同步模式,一般选第一种模式 帧格式:起始位+数据位(5-9位可选)+校验位(可选)+停止位(1、2位) 空闲 o ********* P 1 1 通讯电路空闲时为高电平 二、大概了解了下硬件资源后,就要了解软硬件的桥梁 寄存器了
[单片机]
AVR单片机硬件电路设计
复位线路的设计 Mega16已经内置了上电复位设计。并且在熔丝位里,可以控制复位时的额外时间,故AVR外部的复位线路在上电时,可以设计得很简单:直接拉一只10K的电阻到VCC即可(R0)。 为了可靠,再加上一只0.1uF的电容(C0)以消除干扰、杂波。 D3(1N4148)的作用有两个:作用一是将复位输入的最高电压钳在Vcc+0.5V 左右,另一作用是系统断电时,将R0(10K)电阻短路,让C0快速放电,让下一次来电时,能产生有效的复位。 当AVR在工作时,按下S0开关时,复位脚变成低电平,触发AVR芯片复位。 重要说明:实际应用时,如果你不需要复位按钮,复位脚可以不接任何的零件,AVR芯片也能稳定工作。即这部分不需
[单片机]
<font color='red'>AVR单片机</font>硬件电路设计
AVR单片机EEPROM的操作
本程序简单的示范了如何使用ATMEGA16的EERPOM EEPROM的简介 EEPROM的写操作 EEPROM的读操作 出于简化程序考虑,各种数据没有对外输出,学习时建议使用JTAG ICE硬件仿真器 在打开调试文件到JTAG后, 打开Debug - JTAG ICE Options菜单, 然后在JTAG ICE Properties中点击Dbug页面,将preserve eeprom选项选中。 在每次仿真调试时候,就保护EEPROM内容了。 否则,会按照默认设置擦除EEPROM的内容。 由于定义了EEPROM变量,JTAG调试时会询问是否初始化EEPROM,请选择 EEPROM的数据也可
[单片机]
基于AVR单片机的船舶气象仪测试系统的设计与实现
摘要:针对船舶气象仪保障维修而设计的船舶气象仪测试系统,包括信息处理终端、主仪器检测模块、传感器检测模块,各个模块都采用基于AVR单片机的嵌入式系统,模块之间通过CAN总线进行通信。结果表明,船舶气象仪测试系统能够快速检测船舶气象仪故障,与单纯依靠人工方式排查故障相比,故障检测时间缩短了60%以上。 关键词:船舶气象仪保障维修;船舶气象仪测试系统;AVR单片机;CAN总线 船舶气象仪是船舶导航系统设备之一,可测量船舶所在位置海区的风速、风向、温度、湿度、气压等多项气象要素,可向船舶的导航系统传送实时的气象参数。船舶气象仪一旦出现故障,将会影响船舶操作人员对各种气象要素的估计和判断,甚至导致航行船舶失控、搁浅、触礁、倾覆等严重
[单片机]
基于<font color='red'>AVR单片机</font>的船舶气象仪测试系统的设计与实现
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved