特定人语音识别技术在汽车控制上的应用

发布者:数字火箭最新更新时间:2011-11-07 关键字:人语音识别技术  汽车控制 手机看文章 扫描二维码
随时随地手机看文章

  1 引言

  从20世纪50年代开始对语音识别的研究开始,经过几十年的发展已经达到一定的高度,有的已经从实验室走向市场,如一些玩具、某些部门密码语音输入等,随着DSP和专用集成电路技术的发展,快速傅立叶变换以及近来嵌入式操作系统的研究,使得特定人识别尤其是计算量小的特定人识别成为可能。因此,对特定人语音识别技术在汽车控制上的应用的研究是很有前途的。

  2 特定人语音识别的方法

  目前,常用的说话人识别方法有模板匹配法、统计建模法、联接主义法(即人工神经网络实现)。考虑到数据量、实时性以及识别率的问题,笔者采用基于矢量量化和隐马尔可夫模型(HMM)相结合的方法。

  说话人识别的系统主要由语音特征矢量提取单元(前端处理)、训练单元、识别单元和后处理单元组成,其系统构成如图1所示。

 

  图1系统构成

  由上图也可以看出,每个司机在购买车后必须将自己的语音输入系统,也就是训练过程,当然最好是在安静、次数达到一定的数目。从此在以后驾驶过程中就可以利用这个系统了。

  所谓预处理是指对语音信号的特殊处理:预加重,分帧处理。预加重的目的是提升高频部分,使信号的频谱变得平坦,以便于进行频谱分析或声道参数分析。用具有 6dB/倍频程的提升高频特性的预加重数字滤波器实现。虽然语音信号是非平稳时变的,但是可以认为是局部短时平稳。故语音信号分析常分段或分帧来处理。

  2.1 语音特征矢量提取单元

  说话人识别系统设计中的根本问题是如何从语音信号中提取表征人的基本特征。即语音特征矢量的提取是整个说话人识别系统的基础,对说话人识别的错误拒绝率和错误接受率有着极其重要的影响。同语音识别不同,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性。因此,单一的语音特征矢量很难提高识别率。该系统在说话人的识别中采用倒谱系数加基因周期参数,而在对控制命令的语音识别中仅采用倒谱系数。其中,常用的倒谱系数有2 种,即LPC(线性预测系数)和倒谱参数(LPCC),一种是基于Mel刻度的MFLL(频率倒谱系数)参数(Mel频率谱系数)。

  对于LPCC参数的提取, 可先采用Durbin递推算法、格型算法或者Schur递推算法来求LPC系数,然后求LPC参数。设第l帧语音的LPC系数为αn,则LPCC的参数为1<n≤p

  其中p为LPCC系数的阶数,k为LPCC系数的递推次数。

  进一步的研究发现,引入一阶和二阶差分倒谱可以提高识别率。

  对于MPCC参数的提取,若根据Mel曲线将语音信号频谱分为K个频带,每个频带的能量为θ(Mk),则 MFCC参数为1<n≤p

  通过对LPCC和MFCC参数对识别率影响的实验比较,笔者选取LPCC参数及其一阶和二阶差分倒谱稀疏作为特征参数。

  基音周期估计的方法很多,主要有基于求短时自相关函数的算法、基于求短时平均幅度差函数(AMDF)的算法、基于同态信号处理和线性预测编码的算法。笔者仅介绍基于求短时自相关函数的算法。

  设Sw(n)是一段加窗语音信号,它的非零区间为0<n≤n-1。Sw(n)的自相关函数称为语音信号的S(n)的短时自相关函数,用Rw(l)表示,即Rw(l)=可知短时自相关函数在Rw(0)处最大,且在基音周期的各个整数倍点上有很大的峰值,选择合适的窗函数(窗长为40ms的Hamming窗)与滤波器(带宽为60~900Hz的带通滤波器)后,只要找到自相关函数的第一最大峰值点的位置并计算它与零点的距离,便能估计出基音周期。

  2.2 训练单元

  训练单元的功能是把事先收集到的语音利用一定的算法为每一个待识别的说话人训练出与之相匹配的参数。针对说话人识别在汽车应用中的不同的要求,训练单元也分为2部分:对说话人识别的训练和对待识别词的训练。

       对于说话人识别部分的训练, 针对说话人的特征进行训练,为每个合法用户建立一套或多套HMM模型,同时采用基于矢量量化(VQ)的方法,为每个合法用户建立VQ码本。VQ码本的设计采用LBG算法,初始码本的设置采用分裂法初始码本。

  第2 部分针对控制命令中用到的每个孤立的词条建立多个训练样本,或称为词条样本,估计出该词条的HMM参数(一套或多套)。对一个HMM过程的完整的描述包括:2个模型参数N和M,3组概率度量A,B和π。为了方便起见,通常采用如下方式表示一个完整的模型:λ=(N,M,π,A,B),或者简写为:λ= (π,A,B)。而对于每一个词条V的模型参数,V=1~V,可以用Baum-Welch重估算法。[page]


  2.3 识别单元

  识别单元的功能是利用经训练已经获得的HMM模型参数 和测得的说话人的基音周期在一定的判决条件下辨认出待识别的说话人并估计出待识别的控制命令词串。针对HMM模型参数通常采用的判决条件是最大后验概率,用Viterbi算法实现。

  2.4 后处理单元

  充分利用每个说话人的声道参数和词条中各状态持续时间的概率分布来改进系统的识别率。

  3 系统的实现

  由于汽车的控制命令是有限的词条和数字串的组合, 对这些语音命令的识别属于特定人小词汇量的连接词的识别以及与文本有关的说话人确认,不论是从目前的DSP运算速度还是存储空间来说,实时实现这些语音命令的识别都是完全可能的。

  识别系统组成框图如图所示:在此系统中,对运算能力和存储单元要求非常高的语音识别部分完全由DSP完成。

 

图2 识别系统的组成框图

  框图中识别系统的功能是完成语音的输入、A/D转换及识别,系统中核心部分采用TMS320VC5410。其原因是它的运算速度和存储空间都能满足要求,同时它的一些并行运算硬件结构也非常适合语音识别的各种算法,程序和已经脱机训练好的HMM参数表及相应的词典存放在程序存储器中,数据存储器存放识别过程中的中间计算数据。A/D芯片采用TLC320AD50C, 里面含有A/D、D/A以及低通滤波器和采样保持电路。模拟语音信号的输入主要是通过传声器,保证语音门禁的安全性,转换后的数字语音数据以同步串行通信方式传送给DSP。如图2。

  4 结束语

  语音控制汽车是未来的一种趋势。目前,将语音技术应用于汽车的产品只有在一些玩具中用到,由此可想利用语音技术进行汽车控制这一领域蕴涵着相当大的潜在市场。

  而且,说话人识别技术已经发展到可以应用到实际的阶段了,但目前对说话人识别的应用并不是很多。笔者尝试提出一种比较容易实现的方案,将说话人识别技术应用到实际中。但在实际应用中,说话人识别系统都面临一个共同的问题,即无法区分一个发音是现场发音还是录音回放。针对该现象,笔者提出的说话人识别系统可以有效地防止这种情况发生。具体实现说话人识别系统时,可采用随机或其它方法来生成提示文本。如随机的数字串,以使假冒者无法事先录音,增加驾驶的安全性。

 

关键字:人语音识别技术  汽车控制 引用地址:特定人语音识别技术在汽车控制上的应用

上一篇:基于Android系统的车载娱乐系统软件架构
下一篇:国外汽车音响的设计原理

推荐阅读最新更新时间:2024-05-02 21:41

TMS320F241在混合动力汽车电机控制应用
  随着城市环境污染问题的日益严重,汽车尾气的控制越来越受到人们的重视,很多国家都开展了电动汽车的研究。但是电动汽车存在续驶里程短、动力性能差等弱点,加之成本太高,目前还无法大批量投入市场。为了兼顾传统燃油汽车和电动汽车的优点,国内外都开始进行混合动力汽车的研究。   由于混合动力汽车有两套驱动系统,驱动系统与整车控制单元(VCU)之间的信息交换与协调就显得尤其重要。CAN(Controller Area Network)总线即控制器局域网络,是一种有效支持分布式控制或实时控制的串行通信网络,属于现场总线的范畴,具有实时性强、可靠性高、抗干扰性强、结构简单、操作性好、价格低廉等特点,因此被广泛用于工业控制中。   TMS3
[嵌入式]
NCV8876汽车级高频启停升压控制器应用研究
  NCV8876是一款非同步升压控制器,芯片采用内部斜坡补偿的峰值电流控制模式,控制外部N沟道MOSFET场效应管。具有周期循环电流限制、热关断保护及低静态电流睡眠模式运行的功能。主要用于汽车启停使得输入电池电压骤降,输出保持正常供电的应用。   1. NCV8876的原理介绍   安森美公司的NCV8876是一款非同步升压控制器,用于汽车启停使得输入电池电压骤降,输出保持正常供电的应用。该芯片采用内部斜坡补偿的峰值电流控制模式,控制外部N沟道MOSFET场效应管。该芯片具有周期循环电流限制、热关断保护功能。   其他功能还包括,低静态电流睡眠模式运行。当电源电压低于7.3 V时,NCV8876启动,当电源电压低于6.8 V时,
[嵌入式]
汽车行业中的电子控制板是怎么设计的?
和所有的控制器一样,汽车行业的控制器的流程和其它电子产品的开发差不多的,一般都是需要硬件和软件和测试三方面的工程师去完成,在相关的设计流程上面,又被分为任务不同、测试样件、量产件,人物不同,测试和关注的重点也会不同,下面给大家介绍一下相关内容。 1、硬件设计 项目需求是设计任务开始的第一步,一个完整的项目需要包含控制器和工作环境,外部负载参数,开发人员根据自己的内容进行设计工作,当然项目需求是一个时常会变化的东西,这个也是硬件设计的困难之一。 2、根据相关部件的需要,我们就可以基本确定硬件的总体方案,几路ADC、几路数字输入、几路CAN、几路LIN、几路高低边驱动等等。然后根据所需的接口数量进行器件选型,这里要考虑
[汽车电子]
<font color='red'>汽车</font>行业中的电子<font color='red'>控制</font>板是怎么设计的?
如何对混合动力汽车的高压电池组进行充电控制
绿色革命可能不久就将迎来一场重大胜利。在大规模的电能成为“可储存”和“便携式”能源之时,能量效率将获得显著改善,而且可再生能源的推动工作也将取得进展。可储存性和便携性是液体燃料的主要优势,而通过电池系统提供的电力则拥有提供一种可行替代方案的潜力。电能可在几乎所有的耗能设备中使用,而且,电能也可以从几乎所有的可用能源来产生。核能、太阳能、风能、地热能和液体燃料(汽油、柴油、乙醇、氢等等)都能很容易地转换成电能。因此,与石油燃料相比,电力的重大优势是可以利用最具成本效益的解决方案随时随地产生能量。对电能的规范化可以同时实现规模经济,并免除局部燃料消耗所需的基础设施。优越的电能可储存性便于发电(效率最高,且不是“按需”型的),目前的情况大
[嵌入式]
聊聊新能源汽车的整车控制系统
关于汽车电控系统,它其实并不是新能源电动汽车专有的,燃油车同样具备,只不过新能源电动汽车的电控系统更加的复杂,也更强大。 汽车电控系统,就是汽车电子控制系统,是由模块控制的系统总称,它由硬件和软件构成,电控其实就是车辆所有电子控制系统的软件+硬件的总称,我们可以将整个电控系统理解为车辆的神经系统,这个系统可以控制车辆的运行能力,所以电控系统越强大,车辆的控制与行驶能力越出色。今天咱们就来聊聊新能源汽车的整车控制系统。 整车控制系统由加速踏板位置传感器,制动踏板位置传感器,电子换挡器等输入信号传感器,整车控制器(VCU),电机控制器(MCU),电池管理系统(BMS)等控制模块和驱动电机,动力电池等执行元件组成。 应用图
[嵌入式]
聊聊新能源<font color='red'>汽车</font>的整车<font color='red'>控制</font>系统
传感器在汽车电子控制中的应用
随着电子技术的发展,汽车的电子化程度也越来越高。汽车底盘控制系统的装置与执行器之间的连接,也由简单的机械连接阶段进入了电信号联系阶段。良好的底盘电子控制系统能改善车轮和地面之间的附着状况,进而改善汽车的安全性、动力性和舒适性。电子控制系统在汽车底盘技术中的应用很好地改善了汽车的主动安全性。 常见的底盘控制系统有以下几种:牵引控制、制动控制、悬挂控制和转向控制。传感器是电子技术中的核心器件,是一种进行信号变换的装置,它的作用是把被测的非电量信号转变成为电量信号,是促进汽车技术全面发展的关键器件。在汽车底盘电子控制系统中,是离不开传感器的。用于底盘控制的传感器指的是分布在变速器控制系统、动力转向系统、悬架控制系统、制动系统等中的传感器
[嵌入式]
汽车变截面板簧轧机计算机控制系统的研究
    摘要: 介绍两辊式汽车变截面板簧轧机计算机控制系统的主要硬件结构、设计方法,以及多模态智能控制算法在液压伺服系统中的应用。该控制系统设计合理,运行稳定,控制精度高。     关键词: 变截面轧机  钢板弹簧  多模态智能控制     变截面轧机是生产汽车变截面板簧的关键设备。它将加热到950℃的等截面弹簧钢板通过转动的轧辊压缩及拉拔机构拉拔,使其横断面按照设计的变形曲线改变。目前国内钢板弹簧生产企业或者采用进口轧机如英国西尔公司、德国波克公司的某些产品,或者采用国产的仿西尔公司的三辊轧机及一些简易轧机。简易轧机生产的产品精度低、展宽大,国产三辊轧机能耗、设备的体积较大。     两辊式变
[应用]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved