基于AVR单片机的语音识别系统设计方案

发布者:EtherealLove最新更新时间:2017-12-11 来源: eefocus关键字:AVR单片机  语音识别系统 手机看文章 扫描二维码
随时随地手机看文章

     引言

    传统的人机交互依靠复杂的键盘或按钮来实现,随着科技的发展,一些新型的人机交互方式也随之诞生,带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算量大,一般在计算机上实现,即使是嵌入式方面,多数方案也需要运算能力强的ARM或DSP,并且外扩RAM、FLASH等资源,增加了硬件成本,这些特点无疑限制了语音识别技术的应用,尤其是嵌入式领域。

    本系统采用的主控MCU为Atmel公司的ATMEGA128,语音识别功能则采用ICRoute公司的单芯片LD3320。LD3320内部集成优化过的语音识别算法,无需外部FLASH,RAM资源,可以很好地完成非特定人的语音识别任务。

    1 整体方案设计

    1.1 语音识别原理

    在计算机系统中,语音信号本身的不确定性、动态性和连续性是语音识别的难点。主流的语音识别技术是基于统计模式识别的基本理论,原理如图1所示。

a.JPG


    语音识别通常需要两个阶段完成。第一阶段是训练,主要是提取语音特征,用户往往需要进行几次语音训练,经过预处理和特征提取后获得相应特征参数。第二阶段是识别,识别过程就是将输入的语音特征参数和模型库中的参数进行相似性比较,最后输出匹配度最高的特征参数完成识别过程。

2 硬件电路设计
    硬件框架如图2所示,电路主要由主控制器电路和语音识别电路组成。ATMEGA128控制LD3320语音识别电路,输出结果由ATMEGA128处理,然后通过总线来控制不同的设备。

    摘要:系统以AVR单片机为控制核心,实现对人的语音的识别控制。系统采用的主控芯片为Atreel公司的ATMEGAl28,语音识别功能采用ICR oute公司的单芯片LD3320。LD3320内部集成语音识别算法,无需外部FLASH,RAM资源,可以很好地完成非特定人的语音识别任务。同时该芯片内部集成了MP3播放功能,支持MPEG等格式,可实现语音提示或MP3歌曲的播放功能。由于内部含有16位A/D、D/A转换器和功放电路,所以不需要外接功放电路就可以产生清晰的声音。该系统已经预留好各种接口,具有良好的扩展性。

    关键词:AVR单片机;LD3320;语音识别;非特定人语言识别

    0 引言

    传统的人机交互依靠复杂的键盘或按钮来实现,随着科技的发展,一些新型的人机交互方式也随之诞生,带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算量大,一般在计算机上实现,即使是嵌入式方面,多数方案也需要运算能力强的ARM或DSP,并且外扩RAM、FLASH等资源,增加了硬件成本,这些特点无疑限制了语音识别技术的应用,尤其是嵌入式领域。

    本系统采用的主控MCU为Atmel公司的ATMEGA128,语音识别功能则采用ICRoute公司的单芯片LD3320。LD3320内部集成优化过的语音识别算法,无需外部FLASH,RAM资源,可以很好地完成非特定人的语音识别任务。

    1 整体方案设计

    1.1 语音识别原理

    在计算机系统中,语音信号本身的不确定性、动态性和连续性是语音识别的难点。主流的语音识别技术是基于统计模式识别的基本理论,原理如图1所示。b.JPG

    2.1 控制器电路

    控制器选用Atmel公司生产的ATMEGA128芯片,采用先进的RISC结构,内置128 KB FLASH,4 KB SRAM,4 KB E2PROM等丰富资源。该芯片

    是业界高性能、低功耗的8位微处理器,并在8位单片机市场有着广泛应用。

    2.2 LD3320语音识别电路

    LD3320芯片是一款“语音识别”专用芯片。该芯片集成了语音识别处理器和一些外部电路,包括A/D、D/A转换器、麦克风接口、声音输出接口等,而且可以播放MP3。不需要外接任何的辅助芯片如FLASH,RAM等,直接集成到产品中即可以实现语音识别、声控、人机对话功能。

    图3为LD3320电路原理图,与MCU通信采用SPI总线方式,时钟不能超过1.5MHzc.JPG

    麦克风工作电路如图4所示,音频输出只需将扬声器连接到SPOP和SPON即可。使用SPI总线方式时,LD3320的MD要设为高电平,SPIS设为低电平。SPI总线的引脚有SDI,SDO,SDCK以及SCS。INTB为中断端口,当有识别结果或MP3数据不足时,会触发中断,通知MCU处理。RSTB引脚是LD3320复位端,低电平有效。LED1,LED2作为上电指示灯。d.JPG

    3 软件系统设计

    软件设计主要有两部分,分别为移植LD3320官方代码和编写语音识别应用程序。

    3.1 移植LD3320源代码

    LD3320源代码是基于51单片机实现的,SPI部分采用的是软件模拟方式,但在播放MP3数据时会有停顿现象,原因是51单片机主频较低,导致SPI速率很慢,不能及时更新MP3数据。移植到ATMEGA128需要修改底层寄存器读写函数、中断函数等。底层驱动在Reg_RW.c文件中,首先在Reg_RW.h使用HARD_PARA_PORT宏定义,以支持硬件SPI。然后在Reg_RW.c文件中找到HARD_PARA_PORT对应条件宏的代码段,保留AVR的SPI接口代码。

    3.2 应用程序实现

    在代码中预先设定几个单词:“你好”,“播放音乐”,“打开”。当用户说“播放音乐”时,MCU控制LD3320播放一段音乐,如果是其他词语,则在串口中打印识别结果,然后再次转换到语音识别状态。

    3.2.1 MP3播放代码

    LD3320支持MP3数据播放,播放声音的操作顺序为:

    通用初始化→MP3播放用初始化→调节播放音量→开始播放。

    将MP3数据顺序放入数据寄存器,芯片播放完一定数量的数据时会发出中断请求,在中断函数中连续送入声音数据,直到声音数据结束。MP3播放函数实现代码如下:

   e.JPG

    由于MCU容量限制,选取测试的MP3文件不能太大。首先在计算机上将MP3文件的二进制数据转为标准C数组格式文件,然后将该文件加入工程中。源代码中MP3文件存储在外扩的SPI FLASH中,工程中需要注释和移除全部相关代码。MP3数据读取函数是LD_ReloadMp3Data(),只需将读取的SPI FLASH数据部分改成以数组数据读取的方式即可。

    3.2.2 语音识别程序

    LD3320语音识别芯片完成的操作顺序为:通用初始化→ASR初始化→添加关键词→开启语音识别。在源代码中的RunASR()函数已经实现了上面的过程,直接调用即可开启语音识别功能。

    RunASR()函数代码如下:

    f.JPG
    用户说完话后,LD3320通过打分的方式,将关键词列表中特征最相似的一个作为输出。然后LD3320会产生一个中断信号,此时MCU跳入中断函数读取C5寄存器的值,该值即为识别结果,得到结果后,用户可以根据数值来实现一些功能,比如读取到1,说明是“播放音乐”,那么可以调用前面的PlaySound()函数来播放音乐。

h.JPG

    语音识别控制的关键点在于语音识别的准确率。表1给出了测试结果,当然也可以在识别列表中加入更多的关键词来做测试。通过测试结果可以看出,LD3320的识别率在95%上,能够满足用户需求。

    4 结语

    本文讨论了基于AVR单片机的语音识别系统设计的可行性,并给出了设计方案。通过多次测试结果表明,本系统具有电路运行稳定,语音识别率高,成本低等优点。同时借助于LD3320的MP3播放功能,该系统具有一定的交互性和娱乐性。移植性方面,系统通过简单的修改,可以很方便地将LD3320驱动程序移植到各种嵌入式系统中。随着人们对人工智能功能的需求,语音识别技术将越来越受到人们的关注,相信不久的将来,语音识别将会拥有更广阔的应用。


关键字:AVR单片机  语音识别系统 引用地址:基于AVR单片机的语音识别系统设计方案

上一篇:AVR单片机入门----MEGA端口操作
下一篇:基于AVR单片机的安全工器具监控系统的实现

推荐阅读最新更新时间:2024-03-16 15:49

ARM嵌入式孤立词语音识别系统电路设计
语音识别技术就是能使计算机“听瞳“人类的语言,然后根据其义来执行相应的命令,从而实现为人类服务。随着语音识别的深入研究,对它的技术应用主要有两个方面:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,这些应用系统大都使用专门的硬件系统实现。随着后PC年代的到来,后一种发展将成为语音识别技术和嵌入式系交叉研究的一个非常热门的话题,将进一步推动语音识别技术往智能化方向发展。 音频接口原理图 系统采用的音频编解码器是UDAl341t33I。UDAl341是一个单片模数和数模转换器,带
[单片机]
ARM嵌入式孤立词<font color='red'>语音</font><font color='red'>识别系统</font>电路设计
基于AVR单片机的医用智能输液系统
  静脉输液是我国目前临床治疗中最主要的一种输液方式,在实践工作中,医护人员一般是靠经验和观察通过转动输液器上的滑轮对滴速进行手动调节的。本系统是一种非接触式全自动的静滴检测和报警控制装置,时刻检测液体的滴速,并且在药液滴完后能够自动地切断液体进行本地和远程报警,以通知医护人员及时更换液体,对提高现代医疗服务系统的效率和质量都有着非常重要的意义。   1. 研究意义   目前,医院静脉输液主要是人工控制,由人监控的静脉输液,无法正确调解药液流速,速度过快由于点滴里有钾元素的成分会造成血管刺激,通常刺激会表现为疼痛。但通常输液快慢要看自身身体情况,但输液还是会对血管和心脏,肾脏有刺激。利用现有的科技设计智能输液系统,即可以控制药
[单片机]
基于<font color='red'>AVR单片机</font>的医用智能输液系统
基于AVR单片机与CH375的多通道核辐射探测数据采集系统
该系统采用了AVR单片机、高速器件及USB接口技术,采集速度快,死时间短,计数率高,通信量大。USB所具有的即插即用、通用性强、易扩展、可靠性高等优点改善了各探测通道的使用性能。它不仅是4MeV静电加速器不可缺少的重要组成部分,而且为加速器防辐射安全提供确切依据,同时还为加速器在动植物育种、放射治疗、材料改性、放射化学等诸多方面的应用研究提供可靠的技术数据。整个系统已通过省级科技成果鉴定,实际运行良好。在更换探头和稍作参数调整后,还可将该系统用于其它大范围场地多种辐射的监测。 0 引言 文中介绍了多个探测通道组成的多道核数据采集系统,对4MeV静电加速器核辐射进行监测防护。各个通道采用AVR单片机ATmega128作为主控
[单片机]
基于<font color='red'>AVR单片机</font>与CH375的多通道核辐射探测数据采集系统
AVR单片机电梯外呼板系统设计
随着现代社会的发展,科学技术的进步,出现了众多高层建筑和智能建筑。电梯,作为高层建筑内部一种重要的交通工具,其应用规模日益扩大。而作为电梯系统中必不可少的一部分,电梯召唤显示板(简称电梯外呼板)的应用也随之剧增。 电梯外呼板应用于每层楼的电梯门外,供乘客及电梯维保人员使用。电梯外呼板将乘客及维保人员的需求信息通过CAN总线传达给电梯主板,电梯主板接收信息并执行相应的操作。同时,电梯主板将电梯的实时运行信息通过CAN总线传递给电梯外呼板,通过外呼板LED显示出来,供乘客参阅。 AVR单片机具有高可靠性、功能强、高速度、低功耗和低价位的特点,本系统选用了高档ATmega列AVR单片机ATmegal6。它具有先进的RI-SC结构
[单片机]
<font color='red'>AVR单片机</font>电梯外呼板系统设计
AVR单片机---串口发送
第一种方法: void send1_1byte(uchar k) { while(UCSR1A.5==0){;} UDR1=k; while(UCSR1A.6==0){;} UCSR1A.6=1; } void send0_1byte(uchar k) { while(UCSR0A.5==0){;} UDR0=k; while(UCSR0A.6==0){;} UCSR0A.6=1; } 这种方法常用。 第二种方法: putchar(k);
[单片机]
基于DSP的高速实时语音识别系统的设计
  实时语音识别系统中,由于语音的数据量大,运算复杂,对处理器性能提出了很高的要求,适于采用高速DSP实现。虽然DSP提供了高速和灵活的硬件设计,但是在实时处理系统中,还需结合DSP器件的结构及工作方式,针对语音处理的特点,对软件进行反复优化,以缩短识别时间,满足实时的需求。因此如何对DSP进行优化编程,解决算法的复杂性和硬件存储容量及速度之间的矛盾,成为实现系统性能的关键。本文基于TMS320C6713设计并实现了高速实时语音识别系统,在固定文本的说话人辨识的应用中效果显著。   1 语音识别的原理   语音识别的基本原理框图如图1所示。语音信号中含有丰富的信息,从中提取对语音识别有用的信息的过程,就是特征提取,特征提取方法
[嵌入式]
AVR单片机的调频立体声收音机设计解析
引言 早期的数字FM处理芯片TEA5767由Philips公司开发并被广泛地使用,但该芯片需要外加音频放大电路才能驱动耳机。鉴于此,国内锐迪科微电子公司独立开发了一颗具备高接收灵敏度的FM立体声数字芯片RDA5807P,具有自动搜台、重低音、静音、休眠、直接驱动耳机等优异的性能。本文介绍用RDA5807P芯片设计和制作了一款带遥控功能的收音机。 1 收音机总体设计方案 收音机的总体设计框图如图1所示。本收音机采用单节3.7 V、容量1500 mAh的锂电池作力电源,在使用寿命期内可以用手机充电器反复对它进行充电,使用非常方便。采用低功耗的AVR单片机ATmega8L作为微控制器,负责处理和协调各模块电路的工作,AT
[单片机]
<font color='red'>AVR单片机</font>的调频立体声收音机设计解析
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved