从智障到智能光语音识别就花了100年-电子工程世界

前不久，中文版Bixby开始公测，虽然这并不是Bixby的首次发布，但却意味着新的语音巨头开始打入中国市场。在我们的测试中发现，Bixby拥有优良的识别率，可以实现语音开锁、语音文本转换，并且用户可以通过语音对手机进行电话短信、软件控制、第三方内容接入等各种各样的操作。从某种意义上来说，手机已经实现听懂人的语音。

从智障到智能光语音识别就花了100年

　　当我们看到科幻电影中能与人类对话的人工智能时还会感到十分高科技，其实语音助手早已悄无声息的进入了我们的生活，以至于当你看到现在优秀的语音产品时并不会感到陌生。在我们大多数人的印象中，语音助手仍是比较“弱智”的存在，其实这点也并不能否认。因为机器没有智慧，它不能像人一样思考，或者说它还没有一个足以令它思考的庞大体系。但同样不可否认的是，语音识别方面的人工智能已经拥有相当大的规模。

语音识别已经带来了极大便利

　　举个非常常见的例子，现在的网络电视大多都支持语音搜索功能，这给电视的使用带来了极大的便利。因为电池的输入设备仍旧是遥控，其输入效率无法与键盘匹敌，但支持语音的话，只要对电视输入语音命令，就可以完成交互，十分便利。另外，语音识别交互也为盲人的设备使用带来了福音。其作用不可小觑。

手机语音助手（图片来自网络）

　　相信有不少没关注过语音识别功能的读者都有这样的疑问：兄弟，你开玩笑呢吧？无聊时唤出Siri扯两句，还有家里的智能音箱，就普普通通的语音助手嘛，真有你说得怎么玄乎？而且智能音箱的售价都不贵嘛，高科技的话怎么会这么便宜？还别说，开发语音助手还真不是个小工程。而且通常来说，语音助手难以靠本身变现，至少在你用语音听写时，输入法厂商并没向你收费。所以没有雄厚的资金支持是很难坚持到营收的那一天的。

语音识别还有些鸡肋（图片来自网络）

　　现在我们去看语音助手的厂商宣传，都在说我们的准确率达到了百分之多少。目前来说，准确率达到90%以上已经相当不错。虽然现在已经有了这么高的准确率，但我们还是感觉语音助手有些鸡肋，这与语言的复杂性、第三方接口的完善性有很大关系。本期发烧学堂，我们就来聊一聊语音识别的实现原理，以及语音识别的现状和未来发展，设想一下人工智能什么时候会统治世界。

　　语音识别实现原理：数据库

　　概括的说，语音识别的原理其实并不难理解，大面上和指纹识别的原理相同：设备收集目标语音，然后对收集到的语音进行一系列处理，得到目标语音的特征信息，然后让特征信息与数据库中已存数据进行相似度搜索比对，评分高者即为识别结果。然后通过其他系统的接入来完成设备的语音识别功能。

简要识别过程

　　如果你对语音识别的兴趣不高，那么知道这样的大致原理已经足够。事实上，语音识别的过程是相当复杂的。最直接的原因就在于语音的复杂性。指纹识别只要录入的指纹信息与数据库中的已存信息匹配就可以完成识别，这个数据库包含的数据只有几个指纹信息而已。但语音就完全不同了。

《康熙字典》（引自中华古玩网）

　　《康熙字典》容纳了汉字47035个，由当时的三十多位著名学者历时六年编撰而成。而汉语可不仅仅是孤立的汉字，语言中有升降调，有断句情感，有不同语义的不同理解。同时，全国各地可都不是说普通话的，方言也有很多种，想要建造一个完善的语言数据库难度可想而知。汉语的复杂性正是Bixby中文版要晚于英文版发布的原因。

高准确率的语音识别离不开庞大云端数据库（图片引自网络）

　　庞大的语言数据库难以放置于移动端，这也是几乎所有手机语音助手使用时需要联网的原因。语音识别发展到现在也不是没有离线版，但我们不难发现，离线版的准确率是要远远低于在线版的。另外，刚才我们提到不少语音厂商都宣称准确率达到90%以上，这可以说是十分了不起的，不夸张的说，这时候每提升1个百分比的准确率，都是质的飞跃。这不仅要相当完善的数据库，满足这样的准确率还得效率较高的识别提取算法和自学习系统。

　　当然这样的数据我们要以辨证的眼光来看，俗话说，一句话百样说，汉语言可谓博大精深；而且厂商给出的准确率数据的测试很难具备广泛性，所以有些用户在使用语音识别功能时发现它还很“弱智”，实属正常。

　　语音识别实现原理：算法和自学习

　　刚才我们提到了识别提取算法和自学习系统，在这里我们不妨简单了解一下它们的工作过程：首先语音识别系统对收集到的目标语音进行预处理，这个过程就已经十分复杂，包含语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等等。之后对处理的语音进行特征提取。

数字语音波形（图片来自网络）

　　我们知道，声音的本质是震动，它可以由波形表示，识别则需要对波进行分帧，多个帧构成一个状态，三个状态构成一个音素。英语常用音素集是卡内基梅隆大学的一套由39个音素构成的音素集，汉语一般直接用全部声母和韵母作为音素集，另外汉语识别还分有调无调。之后通过音素系统合成单词或者汉字。当然，之后的匹配和后期内容处理也需要相应算法来完成。

输出文本形式的识别过程

　　自学习系统则更多的是针对数据库来说。将语音转换成文本的语音识别系统要有两个数据库，一是可与提取出的信息进行匹配的声学模型数据库，二是可与之匹配的文本语言数据库。这两个数据库需要提前对大量数据机型训练分析，也就是所说的自学习系统，从而提取出有用的数据模型构成数据库；另外，在识别过程中，自学习系统会归纳用户的使用习惯和识别方式，然后将数据归纳到数据库，从而让识别系统对该用户来说更智能。

　　更进一步总结一下整个识别过程：对采集的目标语音进行处理，获取包含关键信息的语音部分——提取关键信息——识别最小单元字词，分析规定语法排列——分析整句语义，将关键内容断句排列，调整文字构成——根据整体信息修改出现轻微偏差的内容。

　　语音识别现状和未来

Radio Rex玩具狗（图片引自网络）

　　人工智能能在这两年爆发并不是一朝一夕的事，语音识别也不例外。从最初的语音识别雏形，到现在高达90%以上准确率，已经有大约100年的历史。Radio Rex玩具狗生产于上个世纪20年代，这款玩具狗在被呼叫时可以弹出来，被视为语音识别的鼻祖。真正意义上的语音识别研究始于上个世纪50年代，AT&T Bell实验室打造的Audry系统实现了十个英文数字的语音识别。

　　而最近大热的NPU神经网络，早在60年代就已经用于语音识别了。将大词汇量、连续语音、非特定人三大特性基于一身的Sphinx系统诞生于80年代末。90年代以来则是语音识别发展的绝佳时期，政府机构对语音识别技术开始重视，许多著名公司都开始在这方面投入巨资，一大批高水平研究机构都加入了语音识别的研究领域，一时间成绩显著。

科大讯飞的语音听写

　　时至今日，语音识别已经有了突破性进展。2017年8月20日，微软语音识别系统错误率由5.9%降低到5.1%，可达到专业速记员的水平；国内语音识别行业的佼佼者科大讯飞的语音听写准确率则达到了95%，表现强悍。国内诸如阿里、百度、腾讯等大公司，也纷纷发力语音识别，前景一片看好。

科大讯飞汽车语音助手飞鱼系统（图片来自网络）

　　并且，语音识别系统也不会只仅仅用于之前提到的手机交互、智能音箱命令，在玩具、家具家居、汽车、司法、医疗、教育、工业等诸多领域，语音识别系统将发挥不可忽视的作用。毕竟在当下人工智能刚刚起步的时代，在设备无法便捷的探知人类想法之前，语音交互都是最高效的人机交互方式。

　　写在最后

　　看到这里，相信大家已经对语音识别有了一个大致的了解。我们在手机、智能音箱上看到的语音识别，只是语音识别领域表现出的冰山一角，而我们在未来也将会看到有更多形式的语音识别用于日常生活的各个方面，比如语音识别系统配合无人驾驶汽车，只要你跟汽车说去哪，汽车就可以自动载你达到目的地。

　　人工智能什么时候会统治世界，这个问题确实不好说。人工智能已经掌握了自然语言的本领，即便相对于人类的语言能力还很初级，但已经可以依据程序给出相应内容，这就具备了拥有智慧的条件，从某种意义上说，人类智慧就是由一项项基础功能集成而来的。但显然这不是我们要担心的问题，期待并享受人工智能带来的便利就好了。

关键字：智能引用地址：从智障到智能光语音识别就花了100年

上一篇：四摄再升级全面屏拍照旗舰金立S11样张曝光
下一篇：微软发布Windows Server RS4预览版17035

推荐阅读最新更新时间：2024-05-03 17:34

面向物联网时代应用的智能嵌入式平台

关于物联网的猜想众说纷纭，它究竟何时到来还无确定的日期。但有一点可以确定，物联网时代的所有设备都能够实现互连互通。这一憧憬看似简单，实则蕴含了对半导体产业变革性的影响。毫无疑问，连接性是所有设备的基本特征，但要实现随时在线的待命状态，智能的能源管理是必不可少的重要技术，与此同时，设备的安全性、稳定性都是需要重点考虑的设计因素。半导体厂商看到了这些趋势，纷纷开始重新设计产品，希望在物联网来临时最早迎接到那抹曙光。 Marvell全面打造无线微控制器平台面向物联网应用的可穿戴设备、家庭自动化、家庭安防、个人保健、智能家电、配饰与遥控器、汽车、照明、工业互联网以及更多领域，美满电子科技( Marvell )正在打造全面的芯

[物联网]

中国智能手机Q3出货量同比降9%：vivo排第一荣耀增速快

10月28日下午消息，根据数据研究机构Counterpoint Research的每月市场数据，中国智能手机销量在2021年第三季度同比下降9%，但环比增长3%，销量达到7650万部。　　由于消费者需求疲软和部件短缺，尤其是4G芯片，国内智能手机市场在2021年第三季度的销量未能出现任何重大改善。　　研究分析师张萌萌（音译 Mengmeng Zhang ）在评论中国智能手机市场总体状况时表示：“中国智能手机市场依然停滞不前，需求主要来自换机需求。缺乏新的智能手机功能也让许多消费者望而却步。” 　　在评论主要厂商的表现时，高级研究分析师 Ethan Qi 表示：“2021 年第三季度，整体智能手机市场经历了进一步的洗牌，

[手机便携]

楼道中的智能化照明系统设计

　　随着能源问题的日益严重，通过各种科技手段进行节能已变的十分重要。照明设施作为最广泛的耗能设施，如果能够进行更为合理的节能，那么其所带来的环境保护效益和经济效益是显著的。　　文中采用热释红外传感器及相关电路控制实现“人来灯亮，人走灯灭，不走不灭”的设想。通过3 W或5 W大功率LED技术和大功率射灯进行有机的结合，从而组合出新的照明模式。采用电力线载波技术，主机自动检测每个灯的工作情况，如有损坏自动通知主机进行维修，从而减少维护工作量。采用400 V直流总线集中供电方式，减少每个灯的整流滤波环节，从而降低成本，节省能量。　　1 系统总体框图　　本系统采用模块化设计，由主机系统和分机系统组成。主机系统，即终端监视

[嵌入式]

图像处理技术未来将走向智能化自动化

计算机图像处理是将图像信号转换成数字信号并利用计算机对其进行处理。由于计算机的处理速度极快，且数字信号具有失真小、易保存、易传输、抗干扰能力强等特点，因而计算机图像处理的应用十分广泛，包括航空航天、遥测技术、医疗器械、工业自动化检测、安全识别等各大领域。随着科技的发展，图像处理技术逐渐成熟。安防行业对图像处理的特殊要求每一个应用领域都有其特殊性要求，在安防监控行业应用也有其固有的特殊性： 1、对图像清晰度要求较高。在治安监控现场，公安机关往往需要通过监控录像来辨认嫌疑人、证据等，一般清晰度不高的视频都达不到这种要求。在交通监控现场，交警需要通过监控图像来识别车牌、违章行为、驾驶人等

[安防电子]

加码汽车电子领域，村田助力智能汽车驶进现实

近年来，世界各国政府都在不断加大智能交通体系的建设，智能网联汽车的发展逐渐上升到国家战略高度。日前，国家相关部门联合印发《推进"互联网+"便捷交通促进智能交通发展的实施方案》，提出了车联网与自动驾驶技术的创新发展趋势和应用推广路径，全面推进交通与互联网的融合。随着智能网联汽车、新能源汽车的快速崛起，汽车电子行业也将迎来诸多发展机会。作为全球领先的电子元器件制造商，村田制作所（以下简称村田）在汽车电子领域的布局也是由来已久。村田的MEMS传感器具有高精度、高稳定性、高可靠性等特点，很早便深度介入到ABS（制动防抱死系统）、ESC（电子稳定控制系统）等汽车主动安全领域中, 并逐步应用到了前车碰撞报警、盲点监测、车道偏离报警以及

[汽车电子]

智能手机已经“被玩坏了”，来看看未来的“黑科技”

智能手机技术依然在飞速发展，每年都有新的摄像头、处理器以及其他增强功能出现。下面就随电源管理小编一起来了解一下相关内容吧。不久前，智能手机指纹扫描仪、双摄像头以及非接触式支付都曾被认为是疯狂的想法，然而在未来几个月或几年里，仍有许多令人敬畏的技术值得期待。无论你是在等待进行重大升级，还是仅仅对即将到来的东西感兴趣，这里有些智能手机技术将在不久的将来出现在即将推出的设备上。智能手机已经“被玩坏了”，来看看未来的“黑科技” 可折叠屏幕可弯曲的、柔韧灵活的、可折叠的屏幕已经被吹捧为“下一件大事”，但我们最后似乎正接近这样的临界点，这种技术即将被应用到可行的产品上。当然，很多公司都在秘密研究这类技术，联想甚至正准备推出原

[电源管理]

2017慕尼黑上海光博会开幕在即，激光技术助力智能制造

“中国制造2025”战略性地描绘出未来我国制造业转型升级，由初级、低端迈向中高端的发展规划。“中国制造2025”将智能制造作为主攻方向，推进制造过程智能化。激光产业正是在风雨飘摇的世界经济体之中继续保持蓬勃发展的良好势头。在未来五年内，激光行业受益于政府对制造业的重视与扶持，平均年增长率约为10%至15%。这将是中国激光产业迈向成熟稳定发展的五年，期间有更多高新尖激光产品将出现在中国市场上。在中国经济转型发展的关键时期，四大地区激光产业集群业已成形并辐射至周边；激光技术推动我国制造业向全球价值链高端跃升，与此同时，制造业的升级有望推动激光产业再续黄金十年。亚洲第一光电盛宴--加速制造产业升级中国制造正在不断走向世界，市场竞

[工业控制]

如何进击医疗行业，艾吉威以叉车AGV打造出智能化“标本

医疗行业随着新兴数字技术的快速发展及“数实融合模式的成熟，越来越多的应用场景落地于医药企业的数字化管理、智能化生产等领域。自2011年创立伊始，经十余年的技术发展和经验沉淀，在充分了解医药行业生产工艺流程及规范化需求后，艾吉威机器人已形成一套结合自身技术优势和数字化场景应用优势的高效智能化解决方案，助力医药行业把握当前智能化发展的历史机遇，通过智能化、数字化等技术手段和装备实现中国医药行业及其相关配套产业持续健康高质量发展。艾吉威机器人认为，医药行业最大的特点是着重要求药品生产流程的合规化和产品的质量稳定可控。近几年来，智能制造成为未来我国医药行业发展的必然选

[机器人]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

■有奖直播报名:大联大世平集团&恩智浦 | AI 无所不在，单板电脑也可以

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■Follow me第二季第4期来啦！与得捷一起解锁蓝牙/Wi-Fi板【Arduino Nano RP2040 Connect】超能力！

从智障到智能 光语音识别就花了100年

从智障到智能光语音识别就花了100年