基于ARM的实时语音识别系统在家庭监护机器人的实现

发布者:静雅心灵最新更新时间:2013-05-29 来源: 21ic关键字:ARM  实时语音识别系统  家庭监护机器人 手机看文章 扫描二维码
随时随地手机看文章
    语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人人胜的、富有挑战性的课题。

    进入90年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice’98。目前市场上已经出现了语音识别电话、语音识别记事本等产品,如美国VPTC公司的Voice Organizer和法国的Parrot等。

    我国语音识别研究工作开始的较晚,但近年来发展得很快,一直紧跟国际水平,国家也很重视,并把大词汇量语音识别的研究列入“8 63”计划,由中科院声学所、自动化所、清华大学电子工程系及北京大学等单位研究开发,取得了高水平的科研成果,如中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其字准确率或系统响应率可达90%以上。鉴于中国未来庞大的市场,国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者,研究成果已达到相当高水平。

1 系统设计

    文中是家庭监护机器人项目中的语音识别系统设计部分,设计目的是设计出一种可以识别语音的、协助监护家庭行动不方便人员的机器人。为实现该语音识别系统,设计了语音识别系统总体结构框图,如图1所示。

b.JPG



1.1 硬件设计

    文中所研究和设计的功能,都是应用在移动机器人上的。因而系统的研究设计需要考虑到体积小、省电、便于移动的特性,并需具有便于家庭用户操作的友好显示界面。对于语音识别部分,需要用到用于语音识别算法处理的处理器、语音采集电路和语音输出电路,如图2所示。其中语音识别算法运算的处理器主要负责算法的运算处理,相当于机器人的大脑;语音采集电路负责采集外部的声音信号,相当于机器人的耳朵;语音输出电路负责输出话语声音,相当于机器人的嘴巴。

c.JPG



1)语音识别算法处理器选择

    根据系统设计功能的要求,目前常用的语音识别芯片种类一般有:单片机(MCU)、DSP和SoC(System on Circuit)。考虑到普通单片机(MCU)资源的紧缺及运行速度较慢的缺点,因而在本系统设计将不考虑使用单片机(MCU)作为语音识别的处理器。DSP包含用作数字信号处理的专用部件,运算能力强、精度高,但目前DSP的价格比较高,同时考虑到本系统的特性,需要选择一种既有较强的运算能力,合适于语音识别的功能,并且能实现较好的用户操作界面,并带有文件系统(用于识别地图)的功能,因而选择DSP并不是明智之举。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有双内核ARM CortexTM-A8的内核和TMS320C64+TM DSP内核,属于高性能的OMAP35x架构系列产品,满足了系统设计的各种功能特性要求。[page]

    2)语音编解码芯片选择

    机器人选择一款合适的语音处理芯片是非常重要的。考虑到系统中用到了各种电源,并需要对电源进行管理,因此选择TI公司配套的TPS 65930芯片来作为系统语音识别部分的音频编解码处理功能的硬件平台是非常合适的。该芯片是一个集成了电源管理、ADC、嵌入式电源控制(EPC)、全功能的音频编解码器于一体的芯片,满足了系统所有电源管理和音频编解码的需要,为设计的PCB板节省了空间,同时减少了多电源硬件设计的负责布线烦恼。

    3)电路设计

    本文的设计是用在移动机器人上的,因而需要语音的输入、识别处理及语音输出的功能。对于语音的输入采集,本文使用声音传感器麦克风及外围电路来实现。对于语音输出部分,使用功率放大器结合喇叭来使用。设计语音部分原理图如图3所示。

d.JPG

1.2 软件设计

    HTK(Hidden Markov Model Toolkit)是一套专门的建立和处理隐马可夫模型(HMMs)的实验工具包,由英国剑桥大学工程系(Cambridge University Engineering Department,CUED)开发的,主要应用于语音识别领域,也可以应用于语音合成、字符识别和DNA排序等研究领域。HTK经过剑桥大学、Entropic公司及Microsoft公司的不断增强和改进,使其在语音识别领域处于世界领先水平。

    基于HTK的语言识别时,识别结果适用只能显示在DOS或终端上,而且不利于将结果保存、移植或者二次开发利用。在本语音识别系统中使用了HTK接口工具ATK(AnApplication Toolkit for HTK)。ATK是由英国剑桥大学开发的开源语音识别工具,是对HTK的C++多线程封装,跟HTK一样,它支持Linux和Windows,它包括HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASour ce、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog模块部件。

    基于ATK的语音识别软件应用系统的由语音信号采集模块、基于DMA的双向高速RAM存取模块、ATK语音识别模块、系统管理模块、语音输出模块等模块组成,如图4所示。

e.JPG



    在软件设计中,系统管理模块主要负责系统的总体管理调度,是应用系统的调度中心;语音信号采集模块主要负责控制数据采集芯片TPS 65930;基于DMA的双向RAM存取模块主要负责实现DMA驱动及双向RAM的读写存取,使用了通道1来实现高速地把语音信号采集到的数据存储到RAM上,并使用通道2实现高速地把RAM的数据取出来,用于语音的识别;语音输出模块主要负责把相应的音频数据送到TPS65930,并控制TPS6 5930对接收到的音频解码输出到功放电路,实现语音输出的功能。软件的设计流程图如图5所示。

f.JPG

[page]

2 语音识别系统实验及结果

    文中设计的语音识别系统如图6所示。在实验中总共进行了3轮话语测试,每轮300句话语测试,其中150句为家庭监护机器人需要识别的话语,150句话语为机器人不予置理的无关话语。本系统只设置10个需要识别的话语,由15名学生分别读音进行测试。同时对无关话语也是由该15名学生,每人10句分别随机读音测试。从显示结果可以看出,第1轮中,先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出无关话语率为100%,但对需识别的话语中,正确识别出148句,2句识别出错,识别率为98.67%;在第2轮中,同样先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出为无关话语率为100%,但对需识别的话语中,正确识别出142句,8句识别出错,识别率为94.67%;在第3轮中,同样先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出无关话语率为100%,但对需识别的话语中,正确识别出146句,识别率为97.33%。在3轮测试中,系统都能实时响应所有语句,未出现漏句现象。并且在实验测试的过程中,系统的响应速度都非常快,感观上没有时间延迟,与真人交流速度相当。

a.JPG



    从实验测试结果可看出,对于识别10个需要识别的话语的识别率高达94.67%以上,具有较高的识别率,因而该语音识别系统较好达到了家庭监护机器人使用的要求。

3 结论

    文中通过DSP、DMA和ARM Cortex-A8的并行处理,利用双缓冲的方法,在嵌入式Linux上实现了基于ATK的实时语音识别系统。该系统可以实时地实现语音识别,具有较高识别率,较快的响应速度。可以应用在家庭监护机器人及其相关领域中。
关键字:ARM  实时语音识别系统  家庭监护机器人 引用地址:基于ARM的实时语音识别系统在家庭监护机器人的实现

上一篇:德州仪器推出具有 ARM® Cortex™-M3 微控制器的业界最高集成度 ZigBee® 单芯片解决方案满足智能能源基础设施、家庭楼宇自动化以及智能照明系统需
下一篇:LG电子成ARM Cortex-A50系列及下一代Mali GPU先期合作伙伴

推荐阅读最新更新时间:2024-03-16 13:25

德州仪器发布两款超低功耗浮点DSP
德州仪器(TI)日前发布两款超低功耗浮点DSP──TMS320C6745、TMS320C6747,以及一款结合ARM应用处理器与浮点DSP的OMAP-L137。三款组件均以TI C674x DSP核心为基础,具备浮点优势与过去定点装置独具的联机外围、低功耗及低成本等特性。 新的C6745、C6747 DSP及OMAP-L137应用处理器包含USB 2.0/1.1、10/100以太网络及多媒体适配卡/安全数字(MMC/SD)外围,开发人员可轻松地在设计中加入联机功能选项。 长期以来,此类外围只适用于定点装置,或须透过多项个别组件以达到同等效能,然而,许多需透过联机进行高速数据传输或因特网存取功能的应用也相当需要
[嵌入式]
基于ARM高速闪存MCU应对广泛嵌入式需求
  由于采用了ARM7TDMI-S内核,LPC2000系列MCU工作频率达60MHz,与其他8-bit产品相比具有更强的功能延展性。同时它借助片上存储器加 模块实现了“零等待访问”高速闪存功能,提高了指令执行的效率。   此外,LPC2000的外设接口非常丰富,包括UART、SPI、I2C、CAN、ADC、 PWM、RTC等。LPC2000系列MCU应用领域非常广泛,从网络通信、 马达控制,到汽车和消费电子都适合于涉足。   嵌入式系统是面向用户、面向产品、面向应用的,它是将先进计算机技术、半导体技术和电子技术以及各行业的具体应用相结合的产物,因此它是一个高度密集、不断创新的知识集成系统。作为嵌入式系统,它必须能够根据应用的需
[嵌入式]
彭博:英伟达收购Arm案恐遭遇英国封杀 后者或考虑IPO
知情人士透露,英国正考虑封杀英伟达收购Arm一案,原因是考量到潜在的国安风险。 据彭博社报道,英伟达去年9月宣布以400亿美元收购Arm,以便在发展迅速的半导体市场扩大市占。以市值计算,英伟达现在是美国最大的芯片公司,Arm目前则是由日本软银集团持有。 英国文化大臣奥利弗·道登(Oliver Dowden)今年4月要求竞争和市场管理局(CMA)准备一份有关英伟达收购Arm的交易是否可被视为反竞争的报告,并且汇整第三方提出的所有国安疑虑。 报道援引一名知悉政府讨论内情的人士称,这份评估报告已在7月底呈交,内容包含国安疑虑,而英国目前倾向否决这项收购案。另一名知情人士说,出于国安考量,英国可能会对这起合并案进行更深入的评估。 不过,知
[手机便携]
ARM Cortex-M0+内核的特性
学习M0+ 从三个方面学习M0+。学习M0+芯片手册,学习codewarrior10.4,同时尝试着上MQX实时系统。 先学习这款M0+内核。 内核和架构: ARM Cortex-M0+内核,最高可达 48MHz 且支持存储器零等待执行; 单周期 I/O 访问:比标准 I/O 最多快 50%; 提高对外部事件的反应时间,并允许 拆位操作和软件协议仿真; 和 8 位/16 位 MCU 相比更优秀的代码密度:能够减少 Flash 尺寸,系统成本和功耗; 和 ARM Cortex-M0 内核以及 ARM Cortex-M3/M4 子集完全兼容; 线性 4GB 寻址空间:避免了
[单片机]
基于RS485的PC与ARM之间文件传输的实现
  1. 引言   在产业控制场合中,常会要求通过PC向嵌进式微机传输图片文件、数据文件等。RS485由于价格便宜、操纵简单、使用者可以随意编写应用协议等优点,被广泛应用在中等长间隔的控制通讯中。因此,利用RS485实现PC到嵌进式系统的文件传输,十分具有现实意义 。   本文以基于ARM9的三星S3C2410A为嵌进式微处理器,嵌进式Linux为嵌进式操纵系统搭建一个嵌进式系统,成功实现了PC通过RS485向嵌进式系统传输文件。   2. RS485接口先容   RS485是一种多点、双向、平衡传输规范,被命名为TIA/EIA-485-A标准。   RS485由RS232发展而来,它改进了RS232通讯间隔短、速率低的缺点。RS
[单片机]
基于RS485的PC与<font color='red'>ARM</font>之间文件传输的实现
ARM Linux系统开机自动运行特定应用的设置方法
系统服务的命令保存在开发板根文件系统的/usr/etc/rc.local文件中。有的开发板开机后自动运行图形界面程序,需要按住ctrl+c让开发板进入到linux的SHELL提示符界面。其实可通过注释掉rc.local文件中调用图形界面的命令,增加运行用户应用程序的命令,达到开机自动运行用户应用程序的目的。 下面以我做的实验为例,描述具体的实现步骤。该方法源于网络,我加以验证,稍做修改。 1.进入pc机的Linux 操作系统,在/nfs/usr/下通过mkdir lz 命令新建一个名为lz的文件夹,进入lz文件夹,通过mkdir hello新建一个hello文件夹用来存放我们将要编写的hello.c文件和编译生成的可执行文
[单片机]
用J-Flash ARM烧写NorFalsh的方法
烧写Bios到Nor Flash或者Nan Flash是嵌入式系统开发硬件完成后的第一步涉及到软件的工作,很重要。烧写Nor Flash的工具和方法很多,近期网上有一篇用J-Link ARM间接烧写Nor Flash的方法: http://www.ouravr.com/bbs/bbs_content.jsp?bbs_sn=3228953&bbs_page_no=1&search_mode=1&search_text=jlink&bbs_id=9999 本人按部就班,试了一把,感觉还可以,只是有些麻烦。尝试着用J-Flash ARM来烧写,该方法非常简单方便。 前段时间心血来潮,花了近800大洋,买了一个Mini
[单片机]
基于ARM控制器的渗炭炉温度控制系统的设计
渗碳过程工件质量主要取决于对温度的控制,当今市场中温度控制成型的产品均以单片机为控制器。由于一般单片机的速度比较慢,更重要的是其ROM和RAM空间比较小,不能运行较大程序,而基于多任务的操作系统需要的任务堆栈很多,需要的RAM空间很大,故其在发展上受到了很大限制。其欢在开发环境上,DSP需要开发用的仿真器,其价格比较贵,因此本设计排除了使用DSP。ARM系列的ARM7TDM1核嵌入式处理器目前应用得较多,价格比较低,性价比较好,还有免费的开发工具ARM SDT,再配以简单的JTAG仿真器,就可以运行嵌入式开发,因此本设计选用韩国三星公司的S3C44BOX芯片作为主控制器。 1 Samsung S3C4480X芯片简介 Samsu
[应用]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved