基于TI的OMAP平台手持设备语音应用解决方案设计实例

发布者:红尘清梦最新更新时间:2014-11-10 来源: 21ic关键字:手持设备  OMAP  语音应用 手机看文章 扫描二维码
随时随地手机看文章

OMAP平台为开发个人手持设备的语音应用提供完美的解决方案。这种低功耗的OMAP架构把用于语音的DSP信号处理功能与RISC处理器的通用系统性能融合在了一起。设计了开放式软件架构,以鼓励开发语音引擎、语音应用和多媒体等补充应用。包括语音识别器和原型应用等开发支持,可帮助开发商快速建立其自己的产品并缩短产品上市时间。OMAP平台可确保开发商能够通过轻松、灵活添加语音应用牢牢把握个人手持设备的增长机遇。

语音技术的应用正在不断增加,从而为应用开发商在手持设备、移动设备和无线个人设备中增加高价值的功能带来了难得的机会。今天的个人手持设备语音大多时候仅仅局限于语音拨号,但是已经出现了适用于更广泛开发语音识别和文本到语音应用的技术。打算增加语音功能的开发商需要熟知语音技术的方方面面。这些问题不但包括处理和内存要求,而且还包括特定的平台架构和支持如何促进开发过程并缩短上市时间。  

利用语音应用增值可带来丰厚的潜在利益。根据各种市场研究公司的估计,未来两年个人手持设备的综合年增长率预计能达到 20%,到2004年全球的总设备交货量将达到7亿件。为了利用增值语音应用敲开这个巨大的市场,开发商必须求助于能够给他们带来高性能、低功耗的底层技术以及能够帮助他们迅速推出新产品的支持。  

语音功能为用户提供自然的输入和输出方式,它比其他形式的I/O更安全,尤其是当用户在开车期间。在大多应用中,语音都是键盘和显示器的理想补充,而并不是它们的替代品。例如,在非常嘈杂的环境中,听和说可能都不现实,因此用户可能就必须依赖键盘输入和显示阅读。类似,用户通常喜欢用键盘输入某些东西,如:PIN号码和密码,而不愿意大声说出来让别人也听到。  

语音拨号是当今个人无线设备中最常用的语音技术。语音拨号通常无需手和耳朵即可打电话,这是在开车时尤为重要的功能。语音拨号包括名字拨号,即按通讯簿上的名字打电话,另外还包括号码拨号,即说出电话号码。如图1所示,其他潜在的语音应用包括:  

1.语音电子邮件?D?D 包括浏览邮箱、利用语音输入写电子邮件以及收听电子邮件的读出。  
2.信息检索?D?D股票价格、标题新闻、航班信息、天气预报等都可通过语音从互联网收听。例如,用户不用先进入某个网址并输入股票名字或者浏览预定义的列表,便可以命令:"我的股票报价,德州仪器。"  
3.个人信息管理?D?D允许用户通过语音指定预约、查看日历、添加联络信息等等。  
4.语音浏览?D?D利用语音程序菜单,用户可以在网上冲浪、添加语音收藏夹并收听网页内容的读出。  
5.语音导航?D?D在自动和眼不够用的条件下获取导航的完全语音输入/输出驾驶系统。  


  
语音技术问题  

语音系统必须满足某些基本使用要求。很显然,语音输出必须清晰,使用户能够听懂。在给定应用用途中,ASR还必须支持自然语音。何为自然可谓变化无常,包括从逐字发出的简单名字和指令、到说出大量词汇的连续语句。另外,各人的自然语音以及发音方式也不同,因此系统应该能够灵活接受不同说话人说话。识别引擎必须准确,否则用户不会使用这种技术。  

语音的系统要求是需要进行大量处理,有可能包含巨大的内存,这取决于所支持的词库。就基于服务器的应用而言,无线带宽的使用会有所增加。这些因素也会影响其他系统考虑。应用的MIPS和传输要求越高,给定系统的功耗就越高,因此会缩短电池寿命或导致更频繁的充电。当应用需要采用处理器外置存储器时,响应时间也有可能增加。  

某些应用权衡考虑有助于通过放弃手持设备不必要的功能来降低系统要求。只识别少量词语、分散语音的基于说话人的系统会比识别大型词库、连续语音的基于说话人的系统要求少很多的资源。对其他语言的支持会增加处理要求并且使应用所需要的内存加倍。抗噪音和抗干扰性是重要的特性,但是会增加复杂性和内存要求。  [page]

很显然,开发商在增加说话人依赖性、连续语音、词库规模和语言支持等功能时希望尽可能少地降低基本应用的性能。有某些选项有助于减少语音技术中的性能降低,如:分布式语音识别(DSR)。DSR把识别任务分割开,这样手持设备可以把原始语音转换成频谱特性向量,同时服务器执行识别过程。这种方法以及类似的分布式TTS方法依赖于处理方法和传输协议的标准化。尽管这些技术颇有前途,但是,开发商仍然面临个人手持设备中语音应用的有限资源。  

因此,为语音等高性能应用选择适当的平台与精心设计应用的功能同样重要。这种平台必须具有强大的处理能力,同时可以实现高水平的功效,不仅仅是在内核操作中,而且在处理内存中也应如此。应该有足够的MIPS来支持多媒体、安全和其他补充应用。提供集成新算法能力的可编程性也很重要。最后,这种平台必须包含为支持模块化应用开发所设计的软件架构,以帮助开发商快速把产品推向市场。  

OMAP技术:卓越的语音平台  

TI的OMAP平台为在个人手持设备中开发语音应用提供卓越的解决方案。 OMAP1510和OMAP5910处理器的双内核架构集成了高功效的TMS320C55x?数字信号处理器(DSP)和高性能ARM9RISC微处理器。因此,这些OMAP处理器可提供语音所需要的算术集中的信号处理能力,同时还可提供系统层操作所需要的通用性能。OMAP710处理器是高度集成的单芯片解决方案,带有用于无线通讯处理的、基于DSP的GSM/GPRS基带、以及可低功耗执行多媒体应用的专用TI增强ARM925处理器。 OMAP1510、OMAP5910和OMAP710处理器可支持基于低端ARM的语音应用。它们还具有编码兼容性,从而使开发商能够把软件应用集成到针对不同市场的个人产品。OMAP1510和OMAP5910具有DSP处理能力,可处理更集中的语音应用。  


双核硬件架构  

OMAP1510 和OMAP5910的双核硬件平台设计用于最大化系统性能和最小化功耗。在用于个人手持设备时,DSP和RISC内核的结合给这些处理器提供了无与伦比的性能和功耗优势。RISC极其适合处理控制代码,如:用户界面、OS和高级应用。另一方面,DSP更适合语音应用所需要的实时信号处理功能。  

如图2所示,OMAP1510架构包含用于两个处理器的片上高速缓冲存储器,可降低到外部存储器的平均发送次数,同时消除不必要的外部存取的功耗。两个内核的内存管理单元(MMU)提供虚拟物理内存转换。低功耗操作模式可保存不使用或者很少使用处理器期间的能力。  

OMAP1510 架构还包含两个外部存储器接口和单个内存端口。这三个存储器接口彼此完全独立,可同时从任何一个内核或者从DMA单元进行存取。每个处理器都具有自己的外设接口,其不但支持到外围设备的直接连接同时还支持从处理器DMA单元的DMA连接。定时器、通用I/O、UART及监视定时器等在内的片上外设以及彩色 LCD控制器均支持OS一般的要求。  

OMAP5910架构不但提供了片上系统功能同时还带有诸如192KbytesRAM、USB1.1主机和客户机、MMC/SD卡接口、多通道缓冲串口、实时时钟、GPIO及UART、LCD接口、SPI、uWire及i2s等在内的外围设备。与 OMAP1510类似,OMAP5910也包含内置的处理器间通讯机制,其提供与DSP连接的透明接口,以实现更轻松的代码开发。  

 


  
为OMAP平台设计语音应用  

在OMAP 开发商网络中,TI正与多家正在开发ASR、TTS、DSR和语者验证等在内的语音技术的主要第三方开发商展开合作。这些公司在市场中都有自己独到的优势,而且他们还可以把这些优势带给OMAP用户。同时,TI内部开发了充分利用了OMAP平台的双内核架构优势的、专门用于小词库以及小型语音识别等的语音识别软件。TI嵌入式语音识别器(TIESR)可提供如下功能:与说话人无关的指令以及控制功能与说话人无关的连续数字识别与说话人无关的连续语音识别与说话人有关的名称拨号、指令以及控制动态语法和词汇功能,可提高语音浏览等应用噪音环境中的抗扰性用于增强性能的可选说话人适配功能。

语音应用示例  

InfoPhone 是基于这种嵌入式架构的语音应用的一个典型示例,它由TI开发,专门用于无线领域。InfoPhone是一个可实现语音功能的Java应用程序,同时它还可实现有用信息的语音检索。TI为InfoPhone开发了三种原型的基于语音的信息服务,诸如为用户提供股票报价、航班信息和天气预报。每种服务都包含 50个词语的词库,因为具有动态词库功能,系统可以在词库间完美切换。应用设计使键盘输入在说话期间一直保持有效状态,从而在环境中断或者用户需要进行私密输入时提供灵活性。图3说明InfoPhone示例中的语音识别架构。  


关键字:手持设备  OMAP  语音应用 引用地址:基于TI的OMAP平台手持设备语音应用解决方案设计实例

上一篇:基于HT48R065V的24V VFD MCU方案参数设计
下一篇:产生精确PWM波形的DDS电路

推荐阅读最新更新时间:2024-03-16 13:45

OMAP技术实现集成多参数便携式病患监控
  当今的病人监护仪最重要的特性是可移动性、简便易用和可轻松进行病人数据传输。可移动性包含便携性和与其它医疗设备(如麻醉机或除颤器)相连的能力。实施此类病人治疗和监控设备所遇到的挑战是什么?有没有好的解决途径?本文将给你答案。   随着时间的推移,出现了多种用于测量血压、葡萄糖水平、脉搏、呼气末二氧化碳及其它各种生物值的便携式单参数监护仪/仪表。如今,病人监护仪是能够适应各种临床应用、支持各种有线和无线接口的灵活的便携式设备。无论监护仪是单参数设备还是多参数设备,目标功能、功耗和多功能系统通常是关键要求。如今,监护仪可以跟随病人出入手术室、重症监护室、病房,甚至他们的住宅。这对当今世界医疗事业极为重要。   当今的病人监护仪最
[医疗电子]
英特尔下一代手持设备平台Moorestown
  代号为“Moorestown”的英特尔下一代手持设备平台计划于2010年发布,以移动互联网设备(MID)和智能手机为目标市场。   Moorestown包括一个代号为“Lincroft”,集成45纳米1, 2英特尔®凌动™处理器核心、图形与视频引擎以及内存和显示控制器的片上系统(SoC)。该平台还包括代号为“Langwell”的输入/输出平台控制器枢纽(I/O-PCH),除了数项板卡级功能外,它还支持用于和无线、摄像头传感器和闪存连接的多个I/O模块。Moorestown平台附带一个代号为“Briertown”的专用混合信号集成电路(MSIC),并且采用了下一代操作系统电源管理(OSPM)。此外,与Moorestown配套
[嵌入式]
基于双核OMAP5910的嵌入式系统及其应用
引言   随着物联网概念的提出及相关技术的发展,网络化测量控制已成为测控系统发展的必然趋势。然而,当前国内外工业控制领域普遍使用且技术相当成熟的PLC(Programable Logic Controller)基本都不支持网络,也不能简单升级具有网络功能,且模式较为单一。因而,设计与实现了一种网络化通用测控系统平台,以实现网络化测控需求且具有一般平台的通用性能。本文主要介绍了ARM嵌入式系统与ZigBee无线技术相结合的通用网络测控平台的硬件设计。    1 系统硬件总体设计   基于ARM的通用网络测控系统硬件架构如图1所示,本系统在测控端采用基于ARM的CPU,通过网络接口与Internet相连,外围扩展有数字量输入/输
[工业控制]
基于双核<font color='red'>OMAP</font>5910的嵌入式系统及其<font color='red'>应用</font>
语音电路在火控计算机中的应用
在现代大多 控制 系统中,通常使用发光二极管LED、数码管、液晶显示器、蜂鸣器等进行状态/结果显示和故障报警,如果在显示报警仪表上采用数字语言技术,使适合用听觉传送的信息用语言传送,就可以发挥听觉的优势,弥补完全用视觉信号传递信息的不足。近年来随着语音 电路 的迅速发展,语音芯片已经以其直观、生动、与 单片机 接口 方便等优势,越来越广泛的应用于 单片机 控制 系统中了,成为现代控制系统中人机联系的一个友好界面。 1 语音电路分析 语言处理合成芯片很多,大多采用:语言信号-驻极话筒-电压-滤波放大-AD转换数字信号存储。放音时采用:数字信号-DA转换、输出,这在实际使用时存在着以下不足: (1)要使语音不失真地被采样,要求采
[模拟电子]
语音识别系统功能_语音识别系统的应用
  语音识别系统功能   对比语音识别技术的两个发展方向,由于基于不同的运算平台,因此具有不同的特点。大词汇量连续语音识别系统一般都是基于PC机平台,而语音识别专用芯片的中心运算处理器则只是一片低功耗、低价位的智能芯片,与一台甚至多台PC机相比起来,其运算速度,存储容量都非常有限,因而这些由专用芯片实现的语音识别系统有如下几个特点:   1、多为中、小词汇量的语音识别系统,即只能够识别10~100词条。只有近一两年来,才有连续数码或连续字母语音识别专用芯片实现。   2、一般仅限于特定人语音识别的实现,即需要让使用者对所识别的词条先进行学习或训练这一类识别功能对语种、方言和词条没有限制。有的芯片也能够实现非特定人语音识别,即预先将
[嵌入式]
<font color='red'>语音</font>识别系统功能_<font color='red'>语音</font>识别系统的<font color='red'>应用</font>
基于OMAP5912手持多媒体终端的人机接口实现
  0引言   手持多媒体终端以其高渗透力的移动数字媒体方式、全新的业务理念和巨大的市场潜力而倍受关注,已成为世界各国广播和电信产业积极研究和发展的重要领域。手持多媒体终端具有高集成度、低功耗以及使用灵活等优点,故可广泛运用于各种领域。手持多媒体终端对人机接口的设计也越来越人性化、多元化。本系统之所以选用 OMAP5912微处理器,除了它具有低功耗、高性能的特性外,其丰富的外圈接口可提供对各种人机接口的支持,也是其重要因素之一。   1 LCD显示设计   1.1接口框架   本终端设计中包含的人机接口为键盘、触摸屏以及LCD显示屏,图1所示是其接口结构框架。在下面的章节中将对各功能模块分别进行介绍。      1.2 L
[单片机]
基于<font color='red'>OMAP</font>5912手持多媒体终端的人机接口实现
如何在手持设备中将全速USB升级为高速USB
移动手持终端市场已经出现对高速 (HS) USB 的巨大需求,这比预期计划实现的时间要来的更快,开发人员对此有些措手不及,因此他们不得不将这种需求添加到现有的设计中,而不是在未来的设计中重新开始。消费类电子的快速变化特性推动着高速USB的市场需求,例如音乐和图片文件传输。在现有设计中,全速USB用于实现这些文件传输以及其它一些功能,如诊断功能、调制解调器连通性以及系统升级。现在,开发可处理用户文件传输的高速 USB 时需要确保消费者体验不会受到低速数据传输的影响。至于其它全速 USB 功能仍不需要更改为高速 USB 功能,这样一来就带来了更多的软件修改风险和超越了目前高速USB所能提供的高速端点数的要求。 本文将描述开发人员如何
[应用]
ISD4004语音芯片在语音报站器中的应用
摘要:ISD4004语音系列芯片是美国ISD公司推出的产品,具有可多次重复录放、存储时间长、使用时不需扩充存储器、所需外围电路简单等特点。介绍了ISD4004芯片在语音报站器中的一个实际应用,并说明了其功能和使用方法,从而使读者对ISD4004系列语音芯片的使用有个初步的了解。 关键词: ISD4004 单片机 语音报站器 ISD4004语音芯片是由美国ISD公司推出的新产品。关于该语音芯片的引脚说明以及内部电路等,很容易在ISD公司提供的芯片资料中查到,笔者就不进行过多的描述,只简单地对其特点做一介绍。 与普通的录音/重放芯片相比,ISD4004具有如下特点:首先,记录声音没有段长度限制,并且声音记录不需要A/D转换和压
[手机便携]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved