生物技术下一个高点语音识别搭风崛起-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

中国生物特征识别市场规模保持高速增长，近几年中国将在信息技术、信息安全、金融交易、社会安全等领域推动生物特征识别标准化工作，产业潜力很大。自2002-2012年，中国生物识别行业的市场平均增长率都在60%以上，2012年市场规模达到60多亿人民币，而预计到2015年，中国生物识别行业的市场规模将可能达到100亿以上。

据前瞻产业研究院数据显示，指纹识别占生物识别技术的份额最高，但整体呈下降趋势，从2007年的66.9%降至2013年的60.1%，预计到2020年将下降至52%左右；而语音识别、人脸识别、虹膜识别则增长迅速，2020年比重预计分别达22.4%、9.6%、6.4%。从这组数据看，语音识别将是继指纹识别后的另一种被广泛应用生物识别方式。

在智能家居中，智能语音控制逐渐成为产业刚需。来自2014中国语音产业发展白皮书中的数据显示，2014年，全球智能语音产业规模已突破47.5亿美元，较2012年的24.4亿美元增长的近一倍。

关于语音识别

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。也被称为自动语音识别（ASR），其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

语音识别交互的进化历程

回顾人类发展历史，不难看出，随着人类不断进化，从最初通过手掌、肢体使用简单工具、传递简单信息，发展到控制发声并通过耳朵接收，形成了一个以语音为载体的快速信息传递通道和收发闭环，成为人类间最自然、最重要的信息交互手段。声波作为一种音频信号，和视频信号、无线电信号一样是，非接触方式传播，也是人类唯一可以不借助工具就可自由掌控的一种天然“无线”资源。

而且声波对接收指向性的要求更宽松，这个非常宝贵的特性会在很多场景下带来极大便利。特别是对于一些在视觉、触觉等方面存在障碍（如老年人、弱视、残障人士）或不适合（如儿童需要保护视力）的庞大特定人群，语音更是最佳的交互选择。

而作为这种功能在移动端延伸，手机相关的语音交互功能最早要追溯到十几年前的功能机时代。它最初是以语音拨号的形式来实现这种交互，当时以摩托罗拉、诺基亚为首的一批国外手机厂商，通过预先录制预存用户的语音样本，然后使用时由用户进行语音口述，比对预留样本，从而实现语音拨号的功能。

这项功能后续进行了进一步的发展，例如摩托罗拉在其A系列上从语音拨号进化到语音控制层面，就是通过语音能控制手机发短信、打开应用程序诸如音乐等。但是，这一阶段的语音交互技术有个致命的问题，就是准确性不高。因为它采用的是通过预存样本比对的技术来实现，这样的技术受限度很大，主要有以下三个：

A、受外界背景噪音干扰：因为是采用的样本音频分析对比，所以对来源音频的质量要求较高，如果来源音频背景噪音太严重，会造成与预留样本不符而比对失败。想想，你在一个安静的环境里录完音，然后在大街上去使用，这种成功率会高吗？

B、使用者发音前后不一干扰：

同样的道理，你预留的样本音频是健康时的，而使用时因为风寒感冒了，很可能会造成比对失败，这样也会影响成功率。

C、其它使用者无法使用：你的样本是你自己的，如果换成你的爱人，或者小孩，按照这种样本对比，就根本无法使用了。

以上这些因素，造成之前的手机语音功能识别率太低，如同鸡肋，所以也没有在手机中起到决定性的作用。

语音识别应用设备兴起

今年，智能设备的兴起给语音识别带来新生，语音识别技术的进步也让语音识别的应用开始拓展开来。目前，语音识别技术在通信领域已得到广泛的应用，包括AT&T、Verizon、LG电子、诺基亚、摩托罗拉，在终端上都载入了语音识别的技术。另外，在航空领域，美国航空公司也使用了语音识别系统。

在智能交通车联网的影响下，语音识别在智能驾驶中被应用起来：自主式导航语音应用、Telematics系统语音应用、LBS系统语音应用就是三个典型的应用。

自主式导航语音应用

传统的车载导航产品，是用眼睛看的方式获取相关信息，对汽车驾驶者而言存在一定的安全隐患。而车载语音导航系统则从根本上变革了信息获取方式，变看为听，并以语音命令的方式进行设备操控，使车载导航更具人性化，使驾驶者出行更安全、便捷。

Telematics系统语音应用

基于智能语音合成技术，通过Telematics提供的服务，可以为用户语音播报天气情况、交通地图、实时路况信息，甚至是动态新闻、E-mail、小说及自主选择的各种文字信息。基于智能语音识别技术，用户可以对Telematics提供的服务进行语音命令操作与语音信息查询，在驾驶或紧急情况下，省去了层层菜单操作带来的麻烦，也避免了手动操作带来的安全隐患。

LBS系统语音应用

基于智能语音技术的LBS系统（定位服务又叫做移动位置服务LocationBasedService，Lbs)，用户通过语音就可以便捷的找到想要的定点信息，如附近餐馆、咖啡厅、停车场、商贸中心或旅游景点等，系统借助语音识别技术识别用户的需求，并按照距离用户当前位置的远近，搜索到满足要求的定点信息详细情况，并通过语音合成系统将相关信息播报给用户。

在智能家居，语音智能灯让家居生活实现了智能化。“Voccaswitchlight”是一款能将通知设备用户准备发出语音命令，之后用户就可以通过语音命令开启或关闭的灯泡。VoccaPro通过蓝牙连接手机，随意开关灯，任何英语单词都可以，比如带着妹子踱步屋内，你可以伸出双手举向天空，缓缓地（声音要略大）说出“Lettherebelight”（要有光）灯立即随声点亮！

搭载智能穿戴设备，语音识别市场竞争情况分析

其实，智能语音识别早已不是新鲜事，苹果的Siri已为大家所熟知，谷歌的GoogleNow也名声在外。而智能可穿戴设备问世后，将智能语音识别服务推向一个新的高端。智能手环、手表、眼镜等受限于本身的功能化设计，缺少甚至没有屏幕、键盘等输入输出装置，无法实现充分的人机交互，曾经被视为鸡肋的智能语音识别，迎来了用武之地。

“2015年国内智能手表市场将快速发展。AppleWatch全球产能预计是3000万台，国内可能有2百万至3百万台。对应的基于Android的智能手表也会有2百万至3百万台的销量，我们很看好未来智能手表市场。”李志飞表示。

除了可穿戴设备领域，智能语音识别在汽车领域亦可能得到广泛应用。由于人们对行车安全问题越来越重视，未来智能语音助手的应用几率更高。苹果公司已经联合法拉利、奔驰及沃尔沃等汽车厂商，合作推出了CarPlay车载系统，而Google也即将发布车载平台AndroidAuto。此外，在智能家居领域，结合出色的语音识别技术，正处于发力阶段的智能家居平台也将有更多期许。

不过，也有人对可穿戴市场表示了担忧。投资公司PiperJaffray最新的消费者调查数据显示，目前有7%的iPhone用户有意购买苹果的AppleWatch，与2014年9月份的调查结果相比，下滑了1%。三星的GalaxyGear发布前得到了Applewatch一样的关注热度，发布后三星也大力宣传，但最终销量平平。

可穿戴设备的需求究竟如何，目前依旧是一个谜。一旦硬件产品本身卖不出去，接着的问题就是“皮之不存，毛将焉附”，整个生态系统本身的投资和开发都会受到影响。

关键字：高点生物技术语音引用地址：生物技术下一个高点语音识别搭风崛起

上一篇：生物识别新技术基于面部表情的情绪识别
下一篇：最潮应用：指纹识别基本原理及采集方式

推荐阅读最新更新时间：2024-03-16 11:13

基于USB2.0接口的语音采集系统设计

引言　　语音信号的采集和处理在网络、通信、智能仪表、工业控制、医疗卫生、公共安全等领域得到了越来越广泛的应用，而这些工作都需要一套高速的语音信号采集系统来完成，要对语音进行采集就需要一种高速的，能进行长时间、大吞吐量数据传送的计算机接口。USB2.0接口就是一种符合语音采集要求的计算机接口，同时，它还具有支持热插拔、占用系统资源少、易于扩展、使用方便等优点。DSP是利用专门或通用的数字信号处理芯片，以数字计算的方法对信号进行处理，具有处理速度快、灵活、精确、抗干扰能力强、体积小及可靠性高等优点，可满足对信号快速、精确、实时处理及控制的要求，本采集卡采用TI公司高精度浮点DSP芯片TMS320C6713作为主控制器，采用高

[嵌入式]

语音芯片开发：语音采集的原理分析

在进行模拟/数字信号的转换过程中，当采样频率fs.max大于信号中高频率fmax的2倍时，即：fs.max =2fmax,则采样之后的数字信号完整地保留了原始信号中的信息，一般实际应用中保证采样频率为信号高频率的5～10倍，采样定理又称奈奎斯特定理。采样频率，也称为采样速度或者采样率，定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样频率的倒数是采样周期或者叫作采样时间，它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本，是描述声音文件的音质、音调，衡量声卡、声音文件的质量标准。采样频率只能用于周期性采样的采样器，对于非周期性采样的采样器没有规则限制。采样频

[嵌入式]

<font color='red'>语音</font>芯片开发：<font color='red'>语音</font>采集的原理分析

NVIDIA AI 大力推进语音、推荐系统和超大规模推理领域的发展

　　Amazon、Microsoft、Snap 和日本电信电话株式会社部署 NVIDIA AI；NVIDIA Riva 和 Merlin 正式全面上线；NVIDIA AI Enterprise 2.0 支持所有主要数据中心和云平台；NVIDIA AI 加速计划启动　　发布 NVIDIA AI 平台的多项重要更新。该平台是一套致力于推进语音、推荐系统、超大规模推理等工作负载的软件套件，目前已被 Amazon， Microsoft， Snap 和日本电信电话株式会社等全球行业领导者所采用。　　NVIDIA 也宣布了 NVIDIA® AI 加速计划，以助力确保 NVIDIA 软件和解决方案合作伙伴所开发 AI 应用的性能和可

[嵌入式]

深度学习在语音增强中的应用

随着科学技术的发展，语音作为新一代人机交互方式，成为人和智能设备、语音助手交流的重要接口，然而在真实环境中，语音信号不可避免的被各种噪声所干扰，除了各种环境噪声，声波在封闭空间中的衰减和延时反射所引起的混响等都会影响语音的感知质量，研究者将真实场景下影响语音质量的因素总结为三个方面：环境噪声、房间混响和其他说话人干扰，语音增强的目的就是消除上述三个方面的影响。语音增强是指利用音频信号处理的技术以及算法提高失真语音信号的整体感知质量或者可懂度。语音去噪深度学习在语音降噪中的应用广泛，根据处理语音的通道数不同，可以分为单通道降噪和多通道降噪，其中单通道语音的去噪由俄亥俄州立大学的汪德亮团队提出的基于DNN-SVM算法，后来又相

[嵌入式]

Siri算什么三星语音助手Bixby功能将更强大

毫无疑问，人工智能将是智能手机的下一个突破方向，而一直以来，包括苹果、谷歌在内的巨头科技公司都在朝此发展，推出Siri、Google Assistant，因此同为科技界巨头的三星自然也不会错过这个领域。根据此前曝光的消息，三星将在S8上首次推出语音助手Bixby，而在昨天，三星官方也给出了Bixby的官方介绍。　　众所周知，三星此前收购了由Siri创始人推出的VIV项目，使用方式与Siri几乎一样，而Bixby就是收购VIV后推出的最重要的成果。根据网友@机智的姜树介绍，S8将会预装几个支持Bixby的应用程序，并且扩大支持的应用数量，最终发布一个SDK，使得第三方开发人员制作自己ID应用程序与Bixby合作。　　而根据

[手机便携]

解放军智能腕表亮相具备语音指令作业、人体脉率监测等功能

昨天（10日），据《解放军报》披露，在一次开辟通道演练中，一名排爆战士双手“受伤”倒地，通过佩戴的智能腕表，用语音发出了紧急呼救的指令。　　这是全军首款单兵战救训练智能腕表首次在沙场亮相。腕表具备语音指令作业、人体脉率监测、人体动静监视、语音智能呼救、战地心理疏导以及数据一键销毁、遥控销毁等功能。　　当北斗卫星定位失效时，作战单兵仍可利用腕表上报当前位置和伤员情况，也可以召唤火力掩护。　　在中国军队的单兵装备中，融入“黑科技”的不在少数。最重要的就是今年正式亮相的“战略步枪”，即QTS-11单兵综合作战系统。　　这个作战武器能够处理卫星通信、照相摄像以及拐角射击的功能。虽然全枪长度不到1米，重量不到5公斤，但打击力度

[安防电子]

多制式语音编码及其DSP实现

摘要：介绍了一种多制式语音编解码器，在单片TMS320VC5409上完成4路语音的全双工通信，并实现G.729a、CVSD、ADPCM算法之间的编码转换，给出了算法的软硬件实现、算法的运算量及所占用的硬件资源。关键词：多制式语音编解码 TMS320VC5409 G.729a CVSD ADPCM 在各种通信设备中，实时的语音压缩通常在DSP上实现。单一编码算法，由于码率和算法固定，系统的灵活性较差。越来越多的通信服务要求能实现多种、多路编码算法，提供一定范围内的编码速率和编码算法的多种选择，例如软件无线电、IP电话、多媒体终端等。 G.729a是ITU制定的一种高质量的中速率语音编码标准，编码速率为8kbps，目前已在许

[嵌入式]

一种智能电梯语音系统的设计

1 引言随着城市文明化和现代化建设步伐的加快，对建筑物中电梯的服务要求也越来越高，人们越来越追求智能化、人性化的乘梯环境。在电梯语音服务方面，目前主要是传统的人工服务，即通过电梯管理员告知乘客所要到达的楼层以及其他相关的服务信息。本文以单片微机和ISD语音芯片为核心，设计了一种电梯语音服务系统，实现了电梯语音服务的智能化和自动化，以适应各种对服务要求比较高的电梯中。 2 器件功能介绍 Winbond公司的ISD系列语音芯片采用了“直接模拟量存储”(DAST)专利技术，信号无需经过D/A，A/D转换，数字压缩和语音合成等复杂的数字信号处理过程，减少了失真，使其声音存贮效果较以前产品有大幅提高，实际试听主观评价可以

[单片机]