随着机器学习和人工智能的热闹, 国内语音行业可谓是百花齐放。 语音识别技术,到底在研究什么?能多大程度改变我们的生活呢?
语音识别,是一种结合了生理和行为两种成分的生物认证技术。语音是人类交际的最常见形式。 现在我们首选把它运用在各种消费设备上作为发现信息、 分享交流它,并控制我们的环境的手段。
ADI消费产品事业部语音用户界面主管Brian Donnelly
提到智能语音,ADI消费产品事业部语音用户界面主管Brian Donnelly认为现今的智能语音有两种方案:“一种是智能语音算法在系统处理器里面编译执行;另一种是智能语音算法在专门研制的DSP里编译执行。基于智能语音DSP的方案具有待机功耗低,搭配AP不受限制、选择性广, 可有效分担处理器运算量等优点。ADI的基于智能语音DSP的 Sublime Voice远场智能语音识别解决方案已经量产。由于在硬件中嵌入了机器学习与深度学习算法,因此可以高效而准确地捕获语音命令。该解决方案已被国内外的客户设计和应用于机顶盒、条形音箱和电视、智能机器人,智能音箱、住家和办公楼自动控制、家用白电等产品中。”
在技术发展的同时,我们发现语音交互与识别在应用落地过程中逐渐暴露出了一些“局限性”,Brian Donnelly先生提及到:“智能语音的两个衡量维度是有效率与准确率,有效性是指正确捕捉到“唤醒词”,准确性是指正确理解和识别语音和命令的意思。而且背后的最大的挑战来源于在远场(5-10米)与背景噪音强的应用场景,当然,还存在功耗的问题。这需要高品质和有效的算法包括对信号声源的捕捉(DOA)和对环境噪音的去除。ADI在已有产品与下一代产品中都利用机器学习与深度学习算法加强对语音识别算法的加速。所以ADI 的Sublime Voice方案可以使用较少DSP资源进行复杂的计算。某些场景下,计算效率可高达90%。ADI可在降低系统的功耗的情况下,提高语音交互识别反应速度,提高系统计算大样本的能力,提高语音识别的准确率。”
“ADI的Sublime Voice 参考设计方案基于4个拾音采样麦克风可以有效地捕捉来自360度方向上的语音指令。它在技术指标上完全达到了7个麦克风产品的水平的同时又使得产品的设计容易达到小型化和拾音麦克风布局的多样化。” Brian Donnelly先生补充道。
上一篇:五年后,指纹识别市场将达47亿美元
下一篇:大联大品佳集团推出基于新唐科技的智能语音识别解决方案
推荐阅读最新更新时间:2024-03-30 23:51
- 不止射频:Qorvo® 解锁下一代移动设备的无限未来
- 物联网助力电动车充电设施走向未来
- Nordic Semiconductor推出nRF54L15、nRF54L10 和 nRF54L05 下一代无线 SoC
- 射频 FDA 如何使用射频采样 ADC 来增强测试系统
- 基于OPENCV的相机捕捉视频进行人脸检测--米尔NXP i.MX93开发板
- Nordic Semiconductor nRF54H20 超低功耗 SoC 荣获 2024 年世界电子成就奖 (WEAA)
- 英国测试装配神经系统的无人机:无需经常落地进行检查
- 超宽带的力量:重塑汽车、移动设备和工业物联网体验
- 意法半导体发布面向表计及资产跟踪应用的高适应易连接双无线IoT模块