如何利用AVR单片机设计出语音识别系统

2020-03-25来源: eefocus关键字:AVR  单片机  语音识别系统

0 引言

传统的人机交互依靠复杂的键盘或按钮来实现,随着科技的发展,一些新型的人机交互方式也随之诞生,带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算量大,一般在计算机上实现,即使是嵌入式方面,多数方案也需要运算能力强的ARM或DSP,并且外扩RAM、FLASH等资源,增加了硬件成本,这些特点无疑限制了语音识别技术的应用,尤其是嵌入式领域。


本系统采用的主控MCU为Atmel公司的ATMEGA128,语音识别功能则采用ICRoute公司的单芯片LD3320。LD3320内部集成优化过的语音识别算法,无需外部FLASH,RAM资源,可以很好地完成非特定人的语音识别任务。


1 整体方案设计

1.1 语音识别原理

在计算机系统中,语音信号本身的不确定性、动态性和连续性是语音识别的难点。主流的语音识别技术是基于统计模式识别的基本理论,原理如图1所示。

如何利用AVR单片机设计出语音识别系统

2.1 控制器电路

控制器选用Atmel公司生产的ATMEGA128芯片,采用先进的RISC结构,内置128 KB FLASH,4 KB SRAM,4 KB E2PROM等丰富资源。该芯片是业界高性能、低功耗的8位微处理器,并在8位单片机市场有着广泛应用。


2.2 LD3320语音识别电路

LD3320芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路,包括A/D、D/A转换器、麦克风接口、声音输出接口等,而且可以播放MP3。不需要外接任何的辅助芯片如FLASH,RAM等,直接集成到产品中即可以实现语音识别、声控、人机对话功能。


图3为LD3320电路原理图,与MCU通信采用SPI总线方式,时钟不能超过1.5MHz。

如何利用AVR单片机设计出语音识别系统

麦克风工作电路如图4所示,音频输出只需将扬声器连接到SPOP和SPON即可。使用SPI总线方式时,LD3320的MD要设为高电平,SPIS设为低电平。SPI总线的引脚有SDI,SDO,SDCK以及SCS。INTB为中断端口,当有识别结果或MP3数据不足时,会触发中断,通知MCU处理。RSTB引脚是LD3320复位端,低电平有效。LED1,LED2作为上电指示灯。

如何利用AVR单片机设计出语音识别系统

3 软件系统设计

软件设计主要有两部分,分别为移植LD3320官方代码和编写语音识别应用程序。


3.1 移植LD3320源代码

LD3320源代码是基于51单片机实现的,SPI部分采用的是软件模拟方式,但在播放MP3数据时会有停顿现象,原因是51单片机主频较低,导致SPI速率很慢,不能及时更新MP3数据。移植到ATMEGA128需要修改底层寄存器读写函数、中断函数等。底层驱动在Reg_RW.c文件中,首先在Reg_RW.h使用HARD_PARA_PORT宏定义,以支持硬件SPI。然后在Reg_RW.c文件中找到HARD_PARA_PORT对应条件宏的代码段,保留AVR的SPI接口代码。


3.2 应用程序实现

在代码中预先设定几个单词:“你好”,“播放音乐”,“打开”。当用户说“播放音乐”时,MCU控制LD3320播放一段音乐,如果是其他词语,则在串口中打印识别结果,然后再次转换到语音识别状态。


3.2.1 MP3播放代码

LD3320支持MP3数据播放,播放声音的操作顺序为:

通用初始化→MP3播放用初始化→调节播放音量→开始播放。

将MP3数据顺序放入数据寄存器,芯片播放完一定数量的数据时会发出中断请求,在中断函数中连续送入声音数据,直到声音数据结束。MP3播放函数实现代码如下:

如何利用AVR单片机设计出语音识别系统

由于MCU容量限制,选取测试的MP3文件不能太大。首先在计算机上将MP3文件的二进制数据转为标准C数组格式文件,然后将该文件加入工程中。源代码中MP3文件存储在外扩的SPI FLASH中,工程中需要注释和移除全部相关代码。MP3数据读取函数是LD_ReloadMp3Data(),只需将读取的SPI FLASH数据部分改成以数组数据读取的方式即可。


3.2.2 语音识别程序

LD3320语音识别芯片完成的操作顺序为:通用初始化→ASR初始化→添加关键词→开启语音识别。在源代码中的RunASR()函数已经实现了上面的过程,直接调用即可开启语音识别功能。


RunASR()函数代码如下:

如何利用AVR单片机设计出语音识别系统

用户说完话后,LD3320通过打分的方式,将关键词列表中特征最相似的一个作为输出。然后LD3320会产生一个中断信号,此时MCU跳入中断函数读取C5寄存器的值,该值即为识别结果,得到结果后,用户可以根据数值来实现一些功能,比如读取到1,说明是“播放音乐”,那么可以调用前面的PlaySound()函数来播放音乐。

如何利用AVR单片机设计出语音识别系统

语音识别控制的关键点在于语音识别的准确率。表1给出了测试结果,当然也可以在识别列表中加入更多的关键词来做测试。通过测试结果可以看出,LD3320的识别率在95%上,能够满足用户需求。


4 结语

本文讨论了基于AVR单片机的语音识别系统设计的可行性,并给出了设计方案。通过多次测试结果表明,本系统具有电路运行稳定,语音识别率高,成本低等优点。同时借助于LD3320的MP3播放功能,该系统具有一定的交互性和娱乐性。移植性方面,系统通过简单的修改,可以很方便地将LD3320驱动程序移植到各种嵌入式系统中。随着人们对人工智能功能的需求,语音识别技术将越来越受到人们的关注,相信不久的将来,语音识别将会拥有更广阔的应用。

关键字:AVR  单片机  语音识别系统 编辑:什么鱼 引用地址:http://news.eeworld.com.cn/mcu/ic492548.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:基于AVR单片机和温度传感器实现智能温控系统的设计
下一篇:AVR单片机的熔丝应该如何设置

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

AVR单片机IAR AVR C语言中断编程
一、AVRmega16中断向量表向量号 程序地址 中断源 描述 IAR AVR中的定义 1 000 RESET 外部引脚电平引发的复位,上电复位,掉电检测复位,看门狗复位,以及JTAG AVR 复位 RESET_vect 2 002 INT0 外部中断请求0 INT0_vect 3 004 INT1 外部中断请求1 INT1_vect 4 006 TIMER2 COMP 定时器/计数 2 比较匹配 TIMER2_COMP_vect 5 008 TIMER2 OVF 定时器/计数 2 溢出 TIMER2_OVF_vect 6 00A TIMER1 CAPT 定时器/计数 1事件捕捉 TIMER_ CAPT_vect 7 00C
发表于 2020-03-04
AVR看门狗心得
简介:AVR单片机系列(例如,ATMEGA168等)使用增强功能的看门狗(Enhanced Watchdog Timer),与原来的看门狗相比较,除了有相同复位的功能以外,还增加了中断的功能设计时。使用看门狗的中断功能,可以实现从Power Down状态唤醒CPU;另外同时能使中断和复位功能,可以在系统发生错误时,先进入中断状态,保存关键数据到EEPROM,然后在进行系统复位。AVR单片机系列(例如,ATMEGA168等)使用增强功能的看门狗(Enhanced Watchdog Timer),与原来的看门狗相比较,除了有相同复位的功能以外,还增加了中断的功能设计时。使用看门狗的中断功能,可以实现从Power Down状态唤醒CPU
发表于 2020-03-03
AVR看门狗心得
AVR看门狗详解
简介:AVR看门狗 一个硬件单元,当程序由于某种原因跑“飞”了,它就Reset程序。就像小狗看门一样。AVR看门狗 一个硬件单元,当程序由于某种原因跑“飞”了,它就Reset程序。就像小狗看门一样。//Watchdog initialize// prescale: 2048Kvoid watchdog_init(void){WDR(); //this prevents a timout on enablingWDTCR = 0x0F; //WATCHDOG ENABLED - dont forget to issue WDRs}上面是用ICC的App Builder生成的看门狗初始化程序,这些语句达不到初始化看门狗的目的,需要
发表于 2020-03-03
AVR看门狗详解
利用笔记本电脑废热供能的笔记本散热器具体方案
简介:本方案拟利用基于AVR32 AT32UC3A单片机控制器的评估套件和开发系统EVK1100,开发利用电脑废热供电的笔记本电脑散热器。一、项目概述1.1 引言现如今,能源危机日趋严重。人们的环境保护意识在不断提高,在发展新能源的同时,努力提高能源利用率也是一个方向。当前,半导体温差发电技术以其各种优点越来越引起人们的关注。该技术已经被应用于工业余热、废热的回收利用、航天辅助电力系统等。笔记本电脑在工作过程中,其CPU及其他部件的高速运转会产生大量的热量,而且,随着目前笔记本电脑硬件配置的逐渐升级,在提升性能的同时,笔记本电脑的整体发热量也在不断上升。为了解决这个问题,人们设计了散热底座。然而,市面上所看到的笔记本电脑
发表于 2020-03-03
利用笔记本电脑废热供能的笔记本散热器具体方案
AVR熔丝位设置教程
简介:对AVR熔丝位的配置是比较细致的工作,用户往往忽视其重要性,或感到不易掌握。下面给出对AVR熔丝位的配置操作时的一些要点和需要注意的相关事项。(1)在AVR的器件手册中,对熔丝位使用已编程(Programmed)和未编程(Unprogrammed)定义熔丝位的状态,“Unprogrammed”表示熔丝状态为“1”(禁止);“Programmed”表示熔丝状态为“0”(允许)。因此,配置熔丝位的过程实际上是“配置熔丝位成为未编程状态“1”或成为已编程状态“0””。(2)在使用通过选择打钩“√”方式确定熔丝位状态值的编程工具软件时,请首先仔细阅读软件的使用说明,弄清楚“√”表示设置熔丝位状态为“0”还是为“1”。(3)使用
发表于 2020-03-03
DIY智能家庭营养专家系统解决方案
简介:本家庭营养专家采用AVR32为主控制器,通过触摸屏与用户进行交互。用户通过本系统可以进行营养套餐的选择,品质生活建议。同时在用户外出用餐时,通过本系统内置的餐饮平台实现网络订餐。项目背景及介绍随着人们生活水平的不断提高,工作节奏的日益加快,工作压力的加强,生活日益“快餐化”,而由此营养不足和过剩导致的“社会文明病”、“富裕病”等日益危害人民的健康,健康和营养也开始受到越来越多家庭的重视,如何对家庭成员饮食营养给予科学指导,合理膳食、科学配餐将成为目前家庭的一项重要内容之一。本家庭营养专家采用AVR32为主控制器,通过触摸屏与用户进行交互。用户通过本系统可以进行营养套餐的选择,品质生活建议。同时在用户外出用餐时,通过本系统
发表于 2020-03-03
DIY智能家庭营养专家系统解决方案
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved