车上设备人机语音接口-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

1 前言

随着社会信息化的不断深入，车上设备及其功能不断增加，驾驶中使用这些设备的频率很高。由于驾驶员的视觉和手直接控制驾驶操作，传统的基于视觉和手操作的人机接口访问方式，无法适应驾驶中对不断增加的车上设备的访问；不仅使用不方便，而且极大地影响安全性，并占用大量的车上空间。由于驾驶中使用类似于手机等设备引发的事故不断增加，很多地方禁止驾驶中使用这些设备。在对车上设备访问方式进行评估中，由于语言访问方式不需要视觉和手的直接介入，安全性、使用方便性以及占用车上空间等指标远高于其它方式，被认为是最有发展潜力的人机接口方式[1][2][3]。语言交流方式也是人类最自然的交互方式，随着语音识别和语音合成等相关技术的不断成熟，语言接口将不断取代目前基于视觉和手操作的接口。基于语言的人机访问接口将是车上设备人机接口的发展方向。

随着车上电子设备与装置不断增多，传统的连接方式已无法适应线束数量和连接复杂程度的增加，车上网络技术越来越受到重视；普遍认为，所有车上电子装置将通过车上网络连接。车上网络协议以及支撑器件的工业化和标准化也发展非常快。在不久的将来，所有车上电子装置都将通过车上网络连接。所以本系统与被访问的设备之间采用网络连接方式。这有利于本系统与被访问设备的硬件连接和推广应用。它与车上网络之间通过标准网络协议进行通信。把语音接口纳入到车上网络体系中，也是连接语音接口与被访问设备的最有效方式。

车上语音接口的支撑技术是小词汇量语音识别、语音合成和车上网络技术。小词汇量语音识别技术（尤其是孤立词小词汇量识别）已经达到实用水平。采用隐马尔可夫模型的小词汇量识别可以在非特定人和高噪声环境下可靠工作并达到很高的识别率[4]。对于大量的私人用轿车，可以采用特定人识别方式，不仅可以达到更高的识别率，而且可以适应个人说话口音等因素。车上网络已经有较成熟的系统，如CAN 总线、MOST 总线等。而且越来越多的车上设备和总成支持网络连接方式。这些对与本文介绍的系统将来在车上的推广应用提供了有利的支持。

这方面的技术是国际上汽车电子技术研究的一个新领域，被认为是将来车上人机接口的必然发展方向，在我国尚未开展相关研究开发工作。对这项技术进行研究，并开发具有自主知识产权的技术产品，对提高我国汽车整体技术水平，提高我国汽车信息与电子技术产品的市场竞争力，具有重要意义。将来在车上使用语音人机接口方式，已经是一种共识，这项技术的市场潜力巨大。由于在车上应用语音接口方式的显著优点，和语音识别与合成技术已经进入实用阶段，也就是足以支持这类语音接口，国际上各大汽车公司和相应的配件厂家正展开车上语言人机访问方式一系列相关技术的研究，并且取得了一些成果。BOSCH公司最近已经开发出了较为实用的车用语言操纵系统。SENSORY 等公司开发了适用于车辆环境的语音处理器件。这些工作目前还处于开发与完善阶段，不久将进入市场；预计，首先在高档车上使用，随着技术不断成熟成本将下降很快，然后在其它类型车上广泛应用。

2 车上设备与装置

这个语音接口访问的车上设备和功能主要包括通信装置（如电话）、车上计算机、车上媒体装置（如音响设备、CD 播放机等）、车上辅助装置（如空调、车门窗、后视镜等）。语音接口访问的设备不包括驾驶操作中影响安全性的装置和设备（如转向、信号、制动、加速踏板等）。这个接口与被访问设备之间按标准车上网络协议进行连接。

车上语音接口，一方面是一个驾驶员访问其他设备的界面，另一方面它也是一个车用设备。设计中必须遵循汽车环境要求的指标。在汽车环境下应用的设备必须满足一些特定的要求，包括：

(1) 高可靠性；
(2) 低成本；
(3) 工作温度范围-40~125℃；
(4) 应用方便；
(5) 体积小，安装灵活；
(6) 满足环保和电磁兼容要求；
(7) 驾驶中应用时，基本不分散驾驶员的视觉和手操纵的注意力；
(8) 在汽车可能出现的任何状态下，它是安全的（不应引起有害后果）。

3 系统功能与操作方式

3.1 车上语音接口的功能

车上语音接口的主要功能包括：

(1) 上设备的语言命令控制；即通过这个接口，驾驶员可以用语言命令对这些设备进行操作。
(2) 表盘；即可以通过语音方式给出传统仪表盘上的各种汽车状态信息，如车速、燃料状态、蓄电池状态、故障状态信息以及车上数据库信息等。
(3) 语音形式的提示与报警功能。

3.2 基本操作方式

这个语音接口的基本操作为：

(1) 启动：当汽车上电时，这个系统初始化，并进入接受语音命令状态。初始化也可以通过初始化按键随时重新进入。
(2) 初始化完成后，系统可以接受系统控制命令、设备控制命令和信息数据请求命令。
(3) 系统控制命令用于设置和检查语音接口系统状态。
(4) 设备控制命令完成设备访问功能。
(5) 信息数据请求命令完成获取汽车状态或其他数据库中信息的访问。

4 车上语音接口硬件结构

由于这个接口是通过车上网络与被访问系统连接，这个接口本身就是网络中的一个节点。它首先识别输入的语音命令信息，识别后根据识别的结果发送访问命令信息。在这个实验系统中，语音接口通过CAN网络与被访问设备连接。系统硬件结构如图1 所示。它由两个信息通路构成，一个是由驾驶员到被访问设备的控制命令通路，包括拾音器、语音识别、控制信号转换以及与被控制设备的接口。另一个是由信息源或设备到驾驶员的反馈信息通路，包括信息获取设备接口、数据到词句的转换以及语音合成和发音器。语音识别部分完成识别驾驶员命令并转换为命令代码的功能。信号转换部分把命令代码转换为能控制对应设备的电信号形式。这个接口支持数字信号、模拟信号、串行接口信号和CAN 总线网络连接方式。 [page]

图1 硬件结构

对于网络连接方式，只要它的应用层支持，原则上任何连入网络的设备都可以通过这个接口访问。在反馈信息转换部分，反馈的数据或其它形式的信息帧中的数据被转换为对应的词句，在通过语音合成后送入发音器。

实验系统中，核心处理器采用Sensory 公司专门用于语音处理的微处理器芯片的RSC364，它通过CAN控制器接口Intel82527 连入网络。微处理器RSC364 与Intel82527 的连接如图2。

图2 RSC364 与Intel2527 的连接

5 软件结构

语音接口系统的软件包括语音输入滤波程序、语音识别程序、信号转换程序、命令词集数据结构以及网络通信的控制程序等。其总体结构如图3 所示。系统初始化模块包括软件初始化和硬件初始化两部分。硬件初始化主要完成RSC364 和Intel82527 的状态设置。初始化完成后，系统处于等待命令输入状态。当一个命令被识别后，根据识别出的命令分类结果确定下一步的处理。如果这个命令属于系统控制命令则执行系统控制命令处理程序；如果是设备控制命令则转入设备控制命令处理；如果是数据信息请求命令则转入数据信息请求命令处理模块。在每一个模块中，又根据具体不同的命令执行对应的程序。

图3 软件结构[page]

6 语音命令处理策略

语音接口中最重要也是最难处理的是语音命令的识别部分。在车辆环境下，识别方法必须对车辆运行中可能的噪声和车内的回音具有鲁棒性，并且要有足够高的识别准确率和具有响应的实时性。为了实现这些目标，这个系统中，在语音信号输入通道中引入了噪声抵消和回音抵消技术；在语音识别算法中采用多步分层策略，使每一步的有效待识别词汇集尽量小，以提高每一步识别的准确度和提高识别速度。

在语音识别中另外一个问题是对说话人口音语速等方面的适应。由于汽车具有特定人使用的特点，也就是一般有一个特定的人使用这个汽车，所以这个语音识别过程采用特定人语音识别技术，而且RSC364支持特定人语音识别，并具有很高的识别率。它可由使用者直接训练语音识别系统，形成词汇的模板可以大大提高系统对这个使用者的语音识别准确度。

在汽车一定的状态下，和当前输入的命令状态下，下一步输入的可能的有效命令构成这个命令的一个合法后续命令集，依次类推，语音命令之间构成一个树型结构，称为命令树。在正确识别一个命令后，其后续输入的语音识别只在已识别命令的孩子节点集中进行。根据归纳的情况，一个命令的有效后续命令不超过20 个。在这样的词汇集中进行识别，可以达到很高的识别率，而且识别速度很快。

命令树有三层。第一层的可能命令集为：

Top={“复位”，“退出”，“状态”，“故障”，“关闭”，“电话”，“CD”，“车窗”，“空调”，“导航”，“启动提示”，“关闭提示”，“信箱” }

其中有后续（下层）命令的命令有 “电话”，“CD”，“车窗”，“空调”，“导航”， “信箱”表示要打电话的“电话”命令的后续命令有：

Tel-1={“拨号”，“挂机”，“重拨”}

其中，“拨号”的后续命令集为：

Tel-2={“0”， “1”， “2”， “3”， “4”， “5”， “6”， “7”， “8”， “9”， “通话”}。

表示播放C1D 的命令 “CD” 的后续命令集为：

CD-1={“播放”，“关机”，“增大”，“降低”}

车窗控制命令 “车窗”的后续命令集为：

Win-1={“左前”，“左后”，“右前”，“右后”}

表示选择要操作的车窗。其中每一个命令都对应有以下后续命令集：

Win-2={“升”，“降”，“停”}

表示要进行空调操作的“空调”命令有以下后续操作：

AC-1={“启动”，“关闭”，“提高”，“降低”}

在每一种命令的操作过程中都可以通过“复位”命令终止这个过程，而回到初始化时的状态。

每一个命令集在RSC364 中都用一个单独的词汇模板，以便进行训练。

7 结束语

本文介绍的系统可以作为一个统一的车上人机语音接口。与其它方式比较具有以下特点：

（1）成本和价格完全处于车上应用能够接受的范围；单片机（嵌入式系统）能够满足其对计算能力和存储量的要求。
（2）采用噪声和回声抵消等技术，使其完全能够满足车上环境的应用要求，可以达到用户接受的准确率。
（3）通过网络与被访问设备连接，结构灵活、连接线路简单、适应性强。

基于语音的车上设备人机界面被认为是最自然、最安全、也最有发展潜力的人机交互方式。本文介绍的工作，目前还处于研究开发初级阶段，要应用于实车还有很多工作；而且，涉及到车上其它设备的连接问题。但是，这里给出的技术方法已经勾画出了一个完整的体系结构，进一步的工作可以在其基础上细化完成。汽车电子装置的网络化连接已经是一个必然的趋势，在这些装置具备网络连接接口时，本系统的连入就是一个非常自然和简单的事情了。虽然从目前的情况看，语音接口方式还不能推广应用，但它是一项必然要采用的技术方法。超前的研究开发工作对提高我国汽车电子技术水平具有实际意义。

参考文献
1 Charles J. Murray. “Automakers struggle with speech recognition technology,” EE Times Dec 1, 2000
2 Deborah F.Allinger. Charles Strauss and Dennis Kwon. “ Applications of speech technology to unmanned vehicles,” 20th Digital Avionics Systems Conference, Volume: 1, 2001. Page(s): 5B4/1 -5B4/9
3 T. Kuhn, A.Jameel, M.Stumpfle and A. Haddadi, “Hybrid in-car speech recognition for mobile multimedia application.” IEEE 49th Vehicular Technology Conference, Volume: 3 , 1999. Page(s): 2009～2013
4 Lawrence Rabiner, B-H Juang. “Fundamentals of Speech Recognition”. 北京：清华大学出版社，1999(end)

关键字：接口技术车上网络语音识别与合成引用地址：车上设备人机语音接口

上一篇：嵌入式车载计算机设计
下一篇：一线多控线束系统在斯泰尔汽车上的应用

推荐阅读最新更新时间：2024-05-02 22:32

电子与人体的接口技术

　　鉴于电子嵌入系统正在寻求进入并取代更多机械控制系统的方法,有理由预期它们也将会找到进入生物系统如人体的途径。实际上,电子嵌入系统每天都在用各种方式与人体打交道,完成多种功能,如健康监护、管理及维持系统功能（如心脏）、控制药物或将酶注入人体代替失去功能的器官,甚至恢复肢体和感官的功能等。某些情况下,这些功能的实现已经有数十年的历史,而电子学的发展只是降低这些系统的成本,改进替代这些系统的可靠性以及延长它们的生命周期。在其它情况下,这些功能正在实验室中实现,但还需要更细致的改进才能用于现实世界。　　无论是何种情况,电子系统与病人身体的联系都比以往更加紧密。有时这种与人体关联的方式是介入式的,如植入设备会在病人身体内完成自己的整个运

[嵌入式]

从LCD电极读数的单片机接口技术

　　摘要以测量仪表中常见的时分割驱动法驱动的段式LCD显示器为例，分析LCD显示器的电极连接结构和驱动信号波形；介绍单片机读取仪表LCD读数的接口电路。此接口电路应用于笔者开发的自动血压监控仪的研制及临床应用项目中，由8031单片机读取血压计的收缩压、舒张压、心率以及充气和放气时瞬时压强。实验证明，此接口电路工作稳定、可靠。　　通过测量仪表拾取被测信号是单片机前向通道设计中常用的数据采集方式。通常，接口电路从仪表电路中取得相关的模拟信号，经过A/D转换或V/F 转换送入单片机；或者取得一个频率信号，经整形后送入单片机。然而，有些测量仪表电路中可能找不到这样的信号。以电容式压力传感器血压计为例，尽管从其振荡电路中可以取得一

[单片机]

嵌入式系统接入网及其网络接口技术研究

嵌入式系统以应用为中心、以计算机技术为基础、软件硬件可裁剪、适应了各种应用系统中对功能、可靠性、成本、体积、功耗等的严格要求，因此它赢得了巨大的市场，在应用数量上远远超过了各种通用计算机。嵌入式接入Internet是近几年随着计算机网络技术的普及和发展而发展起来的一项新兴概念和技术，它通过为现有嵌入式系统增加因特网接入能力来扩展其功能，一般指设备通过嵌入式模块而非PC系统直接接入Internet，以Internet为介质实现信息交互的过程，通常又称为非PC接入。　　嵌入式系统利用网络接口控制芯片实现与网络的通信功能，成本低，控制方便可靠，满足系统对通信的要求。考虑到本身的特点，在大量工业领域中应用嵌入式设备功能比

[嵌入式]

TMS320C54x与80386EX接口技术

摘要：以TI公司的TMS320C575为例，讨论C54x DSP的主机接口与Intel 80386Ex处理器的连接技术，及软件设计中的注意事项。关键词： MTS320C54x 主机接口（HPI） 80386EX 现代电子技术的发展方向是嵌入式系统。传统的嵌入式系统是基于单片机的，而新一代的嵌入式系统将是以IP核（Intellectual Property Kernel知识产权核）模块为核心，用混合ASIC/MPU/FPGA/DSP生成的硅片直接构成的单片嵌入式产品。在嵌入式系统设计中，特别是智能电子系统以及系统集成设计中，MPU、CPLD/FPGA以及DSP起着重要的核心作用

[嵌入式]

ARM微控制器LPC210X的LCD接口技术

摘要：本文分别以GPI0口直接连接、串行转换连接、CPLD分部连接三种方法阐述了无外部总线的Philips ARM微控制器LPC210X与点阵图形液晶显示器的接口设计，并给出硬件电路框图和主要程序。关键词：ARM LPC210X LCD接口串并转换 CPLD 引言 Philips最近推出了其第一款基于ARM内核的控制器LPC210X，但由于LPC210X外部总线不开放，无法扩展内存、驱动液晶显示器等，给它的推广带来了一定的影响。笔者最近在一工控板项目中采用了该系列芯片，项目后斯应客户要求需对几个参量进行显示并扩展键盘，不得已之下，采用了CPLD，并利用了GPIO口模拟总线和液晶时序与点阵图形液日模块HS12864-16建

[应用]

计算机监控接口技术研究

1 引言串行接口一般包括RS232/422/485，其技术简单成熟，性能可靠，价格低廉，所要求的软硬件环境或条件都很低，广泛应用于计算机及相关领域，遍及调制解调器、串行打印机、各种监控模块、PLC、摄像头云台、数控机床、单片机及相关智能设备，甚至路由器也不例外(通过串口设置参数)。在计算机监控系统中，主控机一般采用工控机，通过串口与监控模块相连，监控模块再连接相应的传感器和执行器，如此形成一个简单的双层结构的计算机监控系统。这种结构主要用于单独的中小型企业或部门，如果属于综合型企业或部门，如电力系统监控，高速公路监控和收费系统，则可以此为基础结构进行扩充，用集线器将众多双层监控系统连接起来，再用交换机将若干集线器连接起来，统一接

[嵌入式]

嵌入式系统中CMOS图像传感器接口技术

　　摘　要：提出了CMOS(互补金属氧化物半导体)图像传感器在嵌入式系统中的接口技术，通过设计软件驱动使嵌入式处理器能够控制CMOS图像传感器图像数据自动采集。并对CMOS图像传感器采集的数据进行插值和自动白平衡处理。此接口模块已经成功地应用于二维条码识读器的图像采集模块中，取得了良好的效果。　　关键词：CMOS图像传感器；嵌入式Linux；总线；嵌入式系统　　背　景　　目前数字摄像技术，主要采用两种方式：一种是使用CCD(电容耦合器件)图像传感器，另一种是使用CMOS(互补金属氧化物半导体)图像传感器。　　CCD图像传感器具有读取噪声低、动态范围大、响应灵敏度高等优点。但CCD技术难以与主流的CMOS

[安防电子]

在屏显示器件MC141541及其接口技术

摘要： MC141541是摩托罗拉公司生产的在屏显示（OSD）芯片。它采用I2C总线，具有接口方便、通用性强的特点，因而能够节省大量的系统资源。可用来显示仪器及设备在视频图像上叠加所测量的参数及信息提示。文中介绍了MC141541与单片机的接口技术，同时给出了一个实际的系统应用程序流程图。关键词：在屏显示器件 I2C总线单片机接口 MC141541 1 引言在某些图像处理系统中，往往需要在显示目标视频图像的同时，显示其参数及提示等信息。如医疗设备B超、CT、X透视，除了在监视器显示人体内部的组织器定外，还要显示相关参数，以辅助医生作出准确诊断。电力系统的红色外检测设备在显示被测目

[电源管理]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~