当语音识别“邂逅”音频监控会怎样？-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

10月，科大讯飞的语音识别技术在老罗的“锤子手机”发布会上火了;云栖大会杭州主会场与其他一些分会场上，阿里云的“小AI”机器人即时文字传译功能暗示;第三届世界互联网大会上，搜狗推出了实时机器翻译产品;11月底，百度语音开放平台和科大讯飞在各自的发布会上再次讨论语音识别技术——语音识别技术引发了科技圈的混战。此时此刻，各种同声翻译和速记哭晕在厕所。

　　
特别是随着人工智能时代的到来，语音识别技术已经超越了正常的人类识别能力，作为人机交互方式的入口，是人工智能重要的一环。目前，人们不断地探索和研发人工智能产品和技术，不论是安防界还是科技界，人工智能推动了每个行业的发展，渗透进人们的日常生活，语音识别技术也得到了飞速的发展。同时，语音识别技术作为音频监控技术努力的方向之一，人工智能时代的语音识别技术也给安防行业的音频监控产品和技术带来了“新鲜的血液”。

众所周知，音频监控已经成为安防行业的重要组成部分，尤其是近几年平安城市建设的推进和反恐进程的加快，音频监控在城市安防系统中应用的越来越多，以弥补视频监控的不足。特别是在公检法机构、机场、铁路、银行等一些领域，越来越多的安防工程急需清晰、逼真的影音同步监控系统，音频监控领域已经成为安防行业的新亮点，连习大大都在全国政法委会上明确提到“智慧城市不能只有图像，而没有声音”。因此，“视频监控+音频监控”成为行业的新潮流，而在人工智能时代迅速发展的语音识别技术会给音频监控带来哪些改变呢？

　　
语音识别是成本最低的生物识别技术

　　
语音识别，是一种结合了生理和行为两种成分的生物认证技术。气管、鼻腔、咽喉、舌头等组织的相互配合，影响了声音的音调、音强和音色，从而形成了每个人声音的独特性，这构成语音的生理基础;而每个人不同的说话内容，则构成了语音的行为基础。因此，语音识别是一种很有趣的过程，既要知道你在说什么内容(行为特征)，又要知道你在以什么样的方式说(生理特征)。

　　
语音识别，是成本最低的生物识别技术。因为不需要依赖昂贵的成像芯片和光学镜头，也没有台式PC和移动终端的限制，只需要一枚麦克风即可采集语音，因此在各种身份认证产品中都可以集成该功能。用户对着麦克风说出特定的短语，系统将用户的语音样本过滤后，与先前存储的语音样本比较，达到一定的近似度阈值，用户就通过了身份认证。

　　
语音识别让音频监控成为“听得懂”的耳朵

　　
语音识别，是一种结合了生理和行为两种成分的生物认证技术。语音识别技术分为“语义识别”和“语音身份识别”两大类应用模式。语义识别，也被称作话语识别、非特定人语音识别，其目的在于理解话语中的单词和句子——也就是话语中的内容。由于几乎可以被任何人使用，语义识别技术的应用场景非常多样化，被集成到各种设备上，已经成为智能硬件发展的主流趋势。

　　
公开资料显示，在技术指标方面，百度语音识别、搜狗输入法语音识别、讯飞输入法语音识别准确率达到97%，腾讯云智能语音识别技术在通用领域中准确率达95%。目前音频监控领域主要通过声源声音的强度信号进行智能分析，准确率有待提高。和视频监控一样，音频监控同样面临数字化智能化的变革，海量的音频数据，只有通过智能分析和判别才能更有意义，而不是停留在存储和监听的基本功能上。

　　
因此将语音识别技术应用到音频监控中，让音频监控设备“听懂”周围环境，才能对危险事件和意外事件进行安全防范。

　　
获得前端高清音质是关键

　　
目前语音识别技术的高准确率是在比较安静的环境下达到的目标，在噪音干扰的情况下如何提升识别率，不仅是众多互联网企业需要努力的，音频监控企业也在研究如何去噪将前端设备收集到的音质高清化。现阶段音频监控行业获取前端高清音质已经到达瓶颈期，如何获取在不同环境下的高清音质成为企业亟待解决的问题，部分企业采取前端采集原始音源数据的同时进行高清数字化转换等方式来获得使用价值更高的音频数据，从而在前端获得更高清的真实数据。

　　
语音识别技术在去噪技术方面的研究也会推动音频监控去噪技术的发展。

　　
结束语

　　
音频监控作为安防行业近年来迅速发展的一个分支，目前已展现出前所未有的勃勃生机，人们把关注的目光开始从能够看见和听见的需求转向寻求高质量的音视频监控。所以，机遇的同时也面临着巨大的挑战——音频大数据时代的到来，安防企业面临着很多问题，比如：如何将收集的声音成为有用的信息，如何处理海量的音频数据，如何将“监控”转化为“防范”……语音识别+音频监控，可以帮助安防企业不断优化音频监控产品、平台和解决方案，提高实际应用率。

　　
语音识别技术在人工智能时代迅速发展，音频监控技术拥抱语音识别，必将更智能！

关键字：语音识别音频监控引用地址：当语音识别“邂逅”音频监控会怎样？

上一篇：基于群体模式的人群聚集检测算法应用分析
下一篇：解放人力巡逻机器人助力实现智能安防

推荐阅读最新更新时间：2024-03-16 11:22

车载语音控制使用下降，消费者对语音识别系统有更高期望

Strategy Analytics的车载用户体验服务展开了一项最新调查，评估消费者对车载语音识别系统和触屏的使用及满意度。频繁使用者对车载触屏和语音控制系统的满意度依旧很高，但整体用户满意度却下降了。尽管车载语音控制的日常使用在欧洲保持平稳，但是在美国和中国却有所下降，尤其是在某些年龄段的用户中。 Strategy Analytics的高级分析师暨报告作者Derek Viita表示，随着移动和居家系统都开始配备语音识别功能，消费者现在开始对该类系统的功能具有更高的期望。汽车行业受制于漫长的开发和生产周期，消费者对汽车电子和消费电子在性能上的差距变得越来越没耐心。 Strategy Analytics车载用户体验总监Ch

[汽车电子]

基于DSP的高速实时语音识别系统的设计

实时语音识别系统中，由于语音的数据量大，运算复杂，对处理器性能提出了很高的要求，适于采用高速DSP实现。虽然DSP提供了高速和灵活的硬件设计，但是在实时处理系统中，还需结合DSP器件的结构及工作方式，针对语音处理的特点，对软件进行反复优化，以缩短识别时间，满足实时的需求。因此如何对DSP进行优化编程，解决算法的复杂性和硬件存储容量及速度之间的矛盾，成为实现系统性能的关键。本文基于TMS320C6713设计并实现了高速实时语音识别系统，在固定文本的说话人辨识的应用中效果显著。 1 语音识别的原理语音识别的基本原理框图如图1所示。语音信号中含有丰富的信息，从中提取对语音识别有用的信息的过程，就是特征提取，特征提取方法是整个语音识

[嵌入式]

语音识别技术的发展及难点分析

与机器进行语音交流，让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”，该技术让机器通过识别和理解，把语音信号转变为相应的文本或命令。在1952年的贝尔研究所，Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。大规模的语音识别研究始于上世纪70年代以后，并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后，语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。同时，语音识别在研究思路上也发生了重大变化，由传统的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外，业内有

[家用电子]

智能玩具的设计-聪明宝宝

1 引言智能化已成为玩具行业的新趋势，让语音技术融入到玩具中，不仅可以赋予玩具“听”“说”的交流能力，使其更加生动、智能，还有利于在儿童中普及现代科学技术，推动语音技术产业化的发展。一些领先技术被应用于今天的玩具领域如：无线电、红外通讯、传感器、语音识别等等。本文介绍的是基于SPCE061A的一种具有语音识别功能的玩具产品，并着重介绍了软硬件设计方法。 2 系统结构硬件结构框图如图 2.1所示：主要由按键输入电路、触摸键输入电路、直流电机驱动电路、光敏器件输入电路、单片机最小系统等部分组成。图 2.1 系统整体框图整个系统工作于4.5V电压下，由3节5号电池提供4.5V电压，经过SPY0029稳压

[单片机]

原来数字信号处理“魔盒”是这样打开的

数字信号处理与计算机科学中的其他领域有很大区别，因为它所使用的是特别的数据类型：信号。在大多数情况下，这些信号来自于对真实世界的感知数据，例如：地震振动，视觉图像，声波等等。数字信号处理是使用数学、算法以及一些技巧来处理被转换成数字形式的信号。这数字信号处理有各种各样的易用，如：视觉图像增强、语音识别与语音生成、数据的压缩存储和传输等。如果我们连接一个模拟—数字转换器到一台计算机上，并用它来获取一组真实世界的数据。数字信号处理会告诉你接下来要做什么？ The roots of DSP are in the 1960s and 1970s when digital computers first became availabl

[嵌入式]

苹果HomePod 15.3 RC版更新：支持6人多语种Siri语音识别

苹果于 1 月 20 日为 HomePod 系列智能音箱推送了 15.3 rc 版固件更新，带来了新功能。本次更新包大小为 467.7MB，通过移动端 App 可以获取。　　新版固件为 HomePod 增强了 Siri 语音的识别能力。最多支持识别 6 个人的语音指令。此外，Siri 还新增了英语（印度口音）、意大利语的支持。此外，本次更新还提高了设备的稳定性和性能。　　据IT之家了解，苹果 HomePod 系列智能音箱于 2019 年起便加入了多用户语音的支持，Siri 可以学习不同的人的声音特点，自适应识别。目前，音箱内置的 Siri 已支持荷兰语、俄语，未来有望支持更多的语言和方言。目前，HomePod 一

[手机便携]

苹果HomePod 15.3 RC版更新：支持6人多语种Siri<font color='red'>语音识别</font>

WTK6900G语音识别芯片在空调遥控器的应用

如今现在的天气逐渐炎热，空调成为了我们的夏日伴侣，当然有的时候因为找不到空调遥控器而烦恼，别家的空调已经开始使用声控的方式了，你还在为找不到遥控器而烦恼？随着智能化的科技逐渐兴起，现在的电器设备都走向了智能化，空调也不例外，生产厂家为了提升用户的使用体验，会嵌入由深圳唯创知音电子有限公司，研发的一款低成本的离线语音识别芯片方案，实现多样化的功能（声控定时、开关、功能切换等），加入WTK6900H-24SS语音识别芯片，躺在床上对着空调喊话，就可以对空调进行控制。空调声控方案，优先选择深圳唯创知音电子，低成本，低功耗：WTK6900G语音识别方案，3~5米识别率可达90%以上，支持定制80条不同命令词。 WTK69

[嵌入式]

语音识别系统的单片机控制

随着信息技术的飞速发展，人们寻求一种更为直接的人机对话方式，声控电脑就是再此基础上发展起来的。声控电脑使用语音识别技术，而语音识别是目前一种热门技术。电脑语音识别系统，可以用声音直接控制电脑工作，是人机接口中最具有人性化的方式。 1 声控电脑原理声控电脑是由人的声音发出指令来控制电脑工作的，可是电脑本身不能识别人的声音，因此必须让电脑先了解熟悉人讲话的声音及腔调来建立参考样本，将原先训练好的声音特色保存为语音参考样本存入电脑。原理流程如图1所示。（1）语音训练将输入的语音经过分析保存为特征参数参考样本，即告诉电脑将来要识别哪些声音。 （2）语音识别将输入的语音经过分析与原先电脑内的参考样本做对比，找

[单片机]