智能车载信息系统设计-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　根据美国交通部的一项研究，全世界人们每周在汽车上度过的交通时间超过5亿小时。既然花在汽车上的时间如此之多，人们希望能够利用这些时间来享受娱乐，同心爱的人说说话，甚至完成一些通常需要在工作场所才能完成的任务。

　　在汽车中保持联系是人们最想实现的，这只要看一看手机的使用就可以知道。另外，路上遭遇严重的交通堵塞，走错了路，或者遇到像汽油用完了之类的常事，都可能影响您准时到达目的地。

　　如何才能让驾驶者在安全驾驶的同时保持联系，并按时到达目的地呢?巧妙的方法是通过语音命令结合互联网连接进行通信和控制。Microsoft Telematics Platform(微软车载信息处理平台)提供了这一功能，它是一种用于集成各种移动设备和通过互联网与无线网络传送信息的集线器。

　　微软车载信息处理平台提供以下功能：

　　·高级的优质语音识别与合成技术

　　·点播Web服务，如避免交通堵塞，访问最新头条新闻，或通过“MSN汽车”频道(目前仅适用于美国)查找距离最近价格最低的加油站

　　·个性化导航：借助GPS寻找感兴趣的地点或指引方向

　　· PDA/手机集成蓝牙技术，将手机和PDA无线连接到汽车的电子系统，让驾驶者能够通过汽车的音响系统使用语音来拨打和接听电话、获得会议提醒和访问重要数据。

　　·通过远程诊断检查车辆的“健康”状况，包括故障与维护报警，从而有可能提高

　　微软公司的汽车业务部与赛灵思共同创建了能够以低成本点提供这些优点的参考平台，从而促进了面向全世界驾驶者的更简单、更可靠且消费得起的解决方案的开发。

　　灵活和可伸缩的平台

　　传统的汽车电子设计方法一直是根据汽车制造商的需要开发很具体的、定制的和固定的解决方案。车载信息系统与信息娱乐正迫使汽车工业对被设计到一个典型的“联网汽车”中的产品和系统进行重新思考。

　　消费世界与汽车的融合(如车载信息系统等应用)已将“消费开发”思想强行灌输给一个传统上缓慢、保守且由成本驱动的行业。由消费行业带来的新需求要求快速变化，因为消费者总是期待着有新的大事的出现。

　　这种需求迫使人们寻求不仅能够满足当前应用而且能够实现未来和潜在未知特性的灵活架构和设计改变方法。这与典型的汽车电子设计通常所要求的多年的开发与验证周期存在冲突。现在，一个目前开发的平台(用于两三年后发布的新车)拥有能够应对在整个产品开发周期内和推出后发生的未知变化的足够系统资源是必需的。

　　对任何平台而言，灵活性和伸缩性对架构能否成功获得市场接受都至关重要，无论是基本系统还是高性能的高端车载信息系统。鉴于此，微软开发了一个真正可以定制和伸缩的汽车标准车载信息处理平台。

　　该平台整合了一个基于ARM9的微控制器，支持32MB闪存/32MB DRAM以上的内存，并包含集成GPS蓝牙和一个GSM电话模块。外部车辆连接包括一个CAN网络接口以及有保护的模拟和数字I/O，用于实现LED驱动和按钮输入等功能。该平台的基本架构如图1所示。

　　微软利用了FPGA技术的灵活性和高集成度能力。该平台使用了一个Spartan-3 XC3S400 FPGA，用于实现多个独立的目的，如GSM电话接口、车辆接口(CAN控制器和K-线路)以及复杂的音频信号调节和路由功能(如图2所示)。

　　FPGA提供的高集成度也具有在一个器件内包含多种总线、接口和时钟的优点，从而使利用EMI的设计容易管理。此外，减少组件数量和电路板空间将降低生产成本，实现更高的制造质量，在任何汽车设计中这些都是重要的因素。

　　在了解了车辆开发的实质和目前已有的众多不同的车辆接口，微软有意设计了一个灵活的解决方案，可允许对后端车辆接口进行快速修改而不影响下层架构和系统性能。例如，在未来将有可能调节FPGA解决方案，使之能满足带有诸如MOST、IDB- 1394或其它数字车辆网络等汽车总线的最终应用的需求。[page]

　　语音识别系统

　　微软车载信息处理平台的核心是语音识别(VR)系统。任何VR系统中的音频信号路径都是模拟偏置/滤波、数字化和数字滤波，最后才将信号送到VR引擎进行语音处理。

　　在此路径中，存在多个多余噪声进入系统(包括电气平台上和汽车环境内，甚至在这些电子装置之前)的机会。产品开发者和汽车制造商都必须确保话筒位置和类型能正确地适用于应用和环境。

　　在完美的情况下，VR系统将接收到干净、连续的语音信号--但鉴于汽车环境的动态本质，设计可接受的语音识别并不是一件容易的事。诸如车速、车窗状态 (开/关)、道路噪声以及天气状况(雨/风)等因素将进一步恶化本来已很难解决的VR系统问题，如语言、口音和性别等。这些附加的因素增强了在信号到达 VR引擎之前采用高适应性数字滤波算法对其进行预处理的重要性。

　　微软选择了用硬件来实现这种信号预处理功能，并采用了赛灵思的并行DSP处理。Spartan-3 FPGA具有多达104个嵌入式18位乘法器，特别适合用于在一个低成本器件中实现紧凑DSP结构，如MAC引擎、分布式算术FIR滤波器以及全并行FIR滤波器。

　　微软还将处理器密集型软件滤波任务卸载到硬件中来实现。当然，这种预处理也可以用ASSP来实现，如专用DSP芯片。但这样做就会失去通过该平台其它部分的高度集成所获得的好处。

　　车载信息系统与VR的结合可以实现专门适用于某些类型的用户和环境(如语言：英语;口音：苏格兰;性别：女)的可适应和可升级的VR引擎和DSP滤波器。

　　在设计汽车产品(特别是车辆的信息娱乐部分)时留有充分备用资源以适应新的和意外的未来升级的重要性同样适用于FPGA。现在对汽车OEM厂商来说越来越清楚的是，采用灵活和可伸缩固件的架构在未来平台中是必需的。

　　虽然目前的微软平台中没有实现系统协处理器，但可以很容易地通过添加软处理器来实现。就像在微软的设计中把DSP处理负荷从主处理器上卸载一样，也可以使用嵌入式处理器(如Xilinx 32位MicroBlaze软处理器或8位PicoBlaze微控制器)从主系统处理器上卸载一些处理负荷。

　　用于汽车应用的FPGA

　　近年来车载电子设备出现了巨大的增长，不仅传统的车身控制和发动机管理方面，还包括驾驶员辅助系统和车载信息系统应用等新的领域。IEEE最近公布的数字显示，汽车电子年增长率为16%，并预计到2005年在一个中型汽车内电子设备的成本将占到总成本的25%。

　　车载信息系统显示出更像消费产品的一些特性--上市时间快，在市时间短，标准和协议不断变化。这些问题将影响工程师们进行设计和选择所需硬件以快速创建、重复和支持未来升级的方法。

　　现在FPGA技术可以满足这些要求。赛灵思承诺将通过其赛灵思汽车(XA)系列产品满足车载信息系统和汽车信息娱乐应用的需求，该系列产品可提供以下特性：

　　·扩展温度范围，最高可达125℃

　　·全生产性零件核准程序(PPAP)支持

　　·行业公认的AEC-Q100器件合格检验流程

　　·遵守世界汽车质量标准ISO TS 16949，并采用无铅封装以符合RoHS指令

　　这些器件基于我们的Spartan系列FPGA，特别适用于要求每逻辑单元(系统门)具有低成本、每I/O低成本、以及诸如在单个器件上拥有多种I/O标准和嵌入式乘法器以实现高速DSP等高级特性的数字设计。

　　本文小结

　　在微软汽车业务部和赛灵思汽车业务部等支持者的承诺下，汽车制造商正将关键技术的融合采用在一个可以帮助实现以下功能的平台内：

　　·一种有价值且消费得起的车载信息系统解决方案

　　·通过无线网络的可靠连接性

　　·高质量语音识别

　　·一种面向应用开发者的得到广泛支持的操作系统

　　·低成本硬件

关键字：车载信息系统语音识别合成技术引用地址：智能车载信息系统设计

上一篇：车载系统在110移动视频指挥系统中的应用
下一篇：GPS在现代交通运输中的应用

推荐阅读最新更新时间：2024-05-02 21:53

基于ATK的实时语音识别系统在家庭监护机器人中的应用实现

语音是人类最常用的交流方式，也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点，计算机对语音的理解是计算机科学中的一个引人人胜的、富有挑战性的课题。进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。IBM公司于1997年开发出汉语ViaVoice语音识别系统，次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice’98。目前市场上已经出现了语音识别电话、语音识别记事本等产品，如美国VPTC公司的Voice Organizer和法国

[单片机]

基于ATK的实时<font color='red'>语音识别</font>系统在家庭监护机器人中的应用实现

Cerence发布目前市场上最先进的语音合成技术

Cerence Inc.(NASDAQ: CRNC)， AI for a world in motion，于8月3日发布了Cerence Reader，这是一款基于神经网络的语音合成（TTS）新产品，为目前市场上最先进的语音合成技术，可以通过像真人一样自然、并富情感的声音为行车中的驾驶者播报新闻。 Cerence Reader利用先进的AI技术和处理器，实现前所未有、富有人类情感表达能力的车载语音功能。Cerence Reader不但具有与真人几乎没有区别的声音，还懂播报长句的自然停顿和呼吸节奏；以及可以基于内容、上下文和新闻类别(包括时事、体育或纪录片)，自动预测适当的播报风格和情感语调。除了播报新闻以外，Cerence R

[汽车电子]

Cerence发布目前市场上最先进的语音<font color='red'>合成</font><font color='red'>技术</font>

基于PSTN的智能家居远程语音控制系统设计

0 引言随着科技的发展，越来越多的智能家居产品进入人们的家庭，如何对它们进行简单、有效的控制是摆在人们面前的一个难题。另一方面，人们渴望用电话在需要时远程控制各种家电以方便生活之需。目前，针对智能家居的远程控制往往采用类似于计算机网络的分层体系结构，成本较高。由于家电控制网络传送的信息量是很少的，不必像计算机网络那样进行分层设计，故结合语音识别技术、PSTN(公共交换电话网)等实现了智能家居的本地及远程控制。 1 整体方案设计目前，常用的语音识别方法有DTW(动态时间规整)、HMM(隐马尔科夫模型)、VQ(矢量量化)和人工神经网络，考虑到数据量、实时性、识别率及控制人为多数的问题，采用了VQ和HMM相结合的方式。

[嵌入式]

车用语音识别技术和触摸屏市场增长强劲

Strategy Analytics全球汽车电子研究服务发布最新研究报告“汽车人机界面技术(HMI)：语音识别和触摸屏具有显著的领先优势”。报告指出，虽然目前全球汽车行业处境艰难，但是支持免提和导航功能的新人机界面技术，仍会给汽车制造商带来新的商机。Strategy Analytics预测语音识别技术和触摸屏市场规模在2015年将达到29亿美元。其它值得关注的HMI技术包括方向盘触摸板，旋转拨号盘，投影技术，电容显示屏和传感器。 Strategy Analytics全球汽车产业服务分析师，也即本报告作者John Canali评论到：“在提供适合的HMI技术时，汽车制造商及其供应商对消费者偏好需要进行深入了解。随着车载

[汽车电子]

汽车语音识别系统市场分析

据麦姆斯咨询报道，2017年至2025年期间，汽车语音识别系统市场规模有望从9.410亿美元增长至38.903亿美元，复合年增长率将达到19.41%。该市场的主要推动力源于：自动驾驶汽车成为未来趋势、原始设备制造商（OEMs）在汽车中控系统中集成多种电子功能，以及对车联网需求的不断增长。基于非人工智能（AI）的市场预计将占据2017年汽车语音识别系统市场的最大份额。然而，在预测期内，基于AI的语音识别系统市场预计将成为增长最快的市场，同时由于技术的进步，该市场增速有望继续加快。此外，技术驱动型公司正将基于AI的语音识别系统应用于为自动驾驶及半自动驾驶汽车开发的先进信息娱乐功能。就市场用量和市场规模而言，在预测期内，豪华型汽车市

[汽车电子]

基于ARM处理器的非特定人语音识别系统设计

　　随着高新技术在军事领域的广泛运用，武器装备逐步向高、精、尖方向发展。传统的军事训练由于训练时间长、训练费用高、训练空间窄，常常不能达到预期的训练效果，已不能满足现代军事训练的需要。为解决上述问题，模拟训练应运而生。　　为进一步提高训练效果，本文利用智能语音交互芯片设计了某模拟训练器的示教与回放系统。示教系统为操作人员生动的演示标准操作流程及相应的操作现象，极大地缩短了对操作人员的培训时间，提高了培训效果。回放系统通过记录操作训练过程中各操作人员的口令、声音强度、动作、时间、操作现象等，待操作训练结束后通过重演训练过程，以便操作者及时纠正自己的问题。示教系统也可理解为对标准操作训练过程的回放。该系统不需要虚拟现实技术的支持，在小

[单片机]

基于ARM处理器的非特定人<font color='red'>语音识别</font>系统设计

采用AP70032单片机语音识别电路设计

　　新型单片语音识别电路HL7003-02，电路结构简单、外围元器件少，设计、制作、调式及操作十分容易，适合爱好者制作各种由语控制的游艺机、家电控制、智能玩具、语音门锁、门钟等等方面。它是根据用户自己的声音输入而识别的音晶片识音辩识的单片IC，它能识别12个不同的字句，可控制不同的输出开关，完成指定的功能。　　电路特点：内置麦克风放大器，内置A/D转换器，12个1.5秒长的字句识别。多功能I/O口，2个普通输入脚，4个触发输入脚，2个输出端口，包含一个4输出口及一个输出口，2个 LED 输出驱动动，不同的编码方式，可做成专用的线路，2.4V~3.3V工作电压，低功耗，自动断电功能。　　单片语音识别电路HL7003-02

[电源管理]

采用AP70032单片机<font color='red'>语音识别</font>电路设计

3G手机语音识别应用中DSP的选择策略

随着DSP技术的进步，计算能力更强、功耗更低和体积更小的DSP已经出现，使3G手机上植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前，基本ASR应用可以分成三大类：1. 语音-文本转换(语音输入)；2. 讲者识别；3. 语音命令控制(语音控制)。这三类功能包含了3G所需的众多ASR性能。语音-文本转换的典型实例是语音拨号和电子邮件听写。讲者识别功能可以通过语音识别安全地读出存储器中的个人数据，从而满足*定购和银行服务等保密性高的应用需要。语音命令控制功能包括连接语音扩展标记语言(VXML)网站内容的语音接口，它支持财经服务与目录助理等业务。目前VXML被用于规范网站内容的语音标签。语音识别的两种方法 3G手机的ASR

[嵌入式]

3G手机<font color='red'>语音识别</font>应用中DSP的选择策略

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■验证并选择心仪MOSFET，探寻选型奥秘！注册、体验双重好礼等你拿~

■评论有奖：元器件采购的秘密法宝，助你做个自带“松弛感”的职场人！

■新栏目器件口碑专辑上线~快来点评吧！

■中星联华直播 | 高速信号完整性分析与测试 — “码”上行动系列线上讲堂