本文编译自Ferrelectronics
当涉及到用于声音和语音控制的传感器技术时,从音频设备本身到软件和算法以及MEMS麦克风正在进行飞跃式发展,此外还包括人工智能驱动的数据分析,创新正在各个方面发生。
Ferrelectronics最近与Yole Dédevelopement的技术与市场分析师和定制项目业务开发人员Dimitrios Damianos就这一趋势以及它最终将如何影响声学事件检测,语音识别和上下文感知,甚至包括使用语音的情感/移情感知等未来应用(亚马逊和苹果已经拥有这方面的专利)进行了采访。
随着语音控制的发展,设计工程师将需要考虑围绕这项技术的独特要求和问题。
FE:你说过MEMS和传感器的下一个创新将在音频、声音和语音控制方面。但它不是已经在这里了吗?会有什么不同?
Dimitrios Damianos(DD):是的。自2003年第一款摩托罗拉Razr手机中加入MEMS麦克风以来,MEMS麦克风一直在使用。从那时起,它们已经取得了长足的进步:它们取代了传统的驻极体电容麦克风(ECM),提供了更好的性能、灵敏度和更低的成本,每年的出货量达到数十亿颗。
从几年前开始,语音控制作为一种人机界面交互(HMI)已经掀起了波澜。现在有许多设备带有语音/虚拟个人助理(VPA)功能,如智能手机、智能手表以及最新的智能扬声器和汽车。音频领域的创新实际上是在一个更大、更全面的范围内进行的。MEMS麦克风需要一流的性能(灵敏度)以及低功耗,因为这些设备都始终处于开启状态。此外,必须捕捉高质量的声音,以便进行有效的处理和高质量的渲染。你知道计算机科学中的概念:垃圾输入,垃圾输出,意思是如果你想从数据中获取一些上下文,它至少必须具有一定的质量。这就是MEMS麦克风不断改进的原因。
在系统层面,你还需要考虑从设备到音频编解码器的整个音频链,音频软件和算法(噪声消除、波束形成等)以及数字信号处理器(DSP),还包括音频放大器和扬声器。因此,创新正在各个方面发生,在优化所有这些变量,尤其是在使用人工智能分析数据方面,这最终会影响声学事件检测、语音识别和上下文感知。
FE:哪些技术进步将加速采用并开辟新的应用程序?边缘端扮演什么角色?
DD:除了MEMS麦克风(压电、光学)和MEMS微型扬声器的一些新技术外,语音作为人机交互的应用也在加速,这主要是因为人工智能计算领域的进步。现在,大多数计算都是在云中完成的,在云中模型被训练,推理也在云中进行。这样就可以对数据进行分析,这有着巨大的价值。
然而,这种情况下的数据通常掌握在全球GAFAMs(谷歌、苹果、Facebook、亚马逊和微软)手中,这有时会引发隐私问题。我们正在看到一种转向,即在云端进行培训,在边缘进行推理,以减少延迟问题。最终,培训和推理都将在边缘进行,以解决隐私问题。在这种情况下,所有操作都在本地设备上完成,没有数据发送到云。所有的训练都是在小尺寸、靠近设备(在边缘)和足够低的功率下完成的,机器算法正在被重新构建,新的计算架构正在被研究,例如神经网络。
FE:那成本呢?需要大幅降低才能实现你预测的市场规模吗?
DD:成本没有问题。MEMS麦克风每年生产十亿个,价格非常低廉,通常在0.1-0.3美元之间,这取决于制造商和订单规模。我们预测的MEMS麦克风的特定市场规模将通过两种方式实现:MEMS麦克风在各种消费设备中的附着率不断提高,以及终端系统容量的增长。采用语音作为人机交互将取决于整个系统的成本、性能和功能,包括MEMS麦克风、扬声器、音频处理器或计算芯片等。
FE:未来的应用有哪些?
DD:随着语音作为各种日常设备的接口越来越多地被采用,我们正朝着语音互联网(IoV)时代迈进。所以说真的,未来就在这里,随着硬件和软件的不断完善,它将不断地变得更好,为用户提供更具包容性和个性化的体验。这样,随着各种延迟、功耗、计算和隐私问题开始明朗化,越来越多的人将在日常生活中使用语音助手。
一个未来的应用将是使用语音(有时还包括其他传感器)数据的情感/移情感知功能,从你的语气可以推断出你的情绪。亚马逊和苹果已经拥有了专利。亚马逊也有一个新的可穿戴设备,亚马逊Halo腕带,它可以分析你的语调。
FE:特别是考虑到老年人口的不断增长,我们什么时候才能看到基于MEMS麦克风的助听器?
DD:每个助听器制造商都有不同的要求,他们希望开发出一种特定的麦克风,这使得这个市场成为一个需求量很高的市场(需要高质量的麦克风),这反过来又导致了高质量麦克风的高售价。考虑到这些限制,对于各种麦克风制造商来说,这似乎不是一个非常有利可图的市场。
然而,MEMS麦克风越来越多地被用于助听器,尽管传统的ECM仍然是这种应用中最常用的麦克风。MEMS麦克风的体积小一直是其主要优势,但现在它们在噪声性能、功耗、稳定性和助听器的还原性方面的性能与ECM相似或更好。MEMS麦克风使定向听力、语音识别和放大等新功能变得更加精确,从而最终产生更好的助听器。
上一篇:TDK推出脉冲密度调制技术麦克风,具有超宽动态范围
下一篇:Knowles发布AISonic开发套件以加快蓝牙设备的语音集成
推荐阅读最新更新时间:2024-11-12 15:11
- 泰矽微重磅发布超高集成度车规触控芯片TCAE10
- 我国科学家首创、国际首款:自主研制百通道百万像素的高光谱实时成像器件
- Melexis发布突破性Arcminaxis™位置感应技术及产品,专为机器人关节打造
- 艾迈斯欧司朗举办中国发展中心圆桌论坛:贴近本土客户需求 引领智能时代新航向
- 利用运动唤醒功能优化视觉系统的功耗
- 英飞凌推出新型车规级激光驱动器IC, 进一步丰富了领先的REAL3™飞行时间产品组合
- Qorvo® 入选联发科技 MediaTek Dimensity 9400 首发 Wi-Fi 7 FEM 重要供应商
- 大陆集团携手纳芯微,打造更安全的汽车压力传感器芯片
- 思特威推出超星光级系列4MP图像传感器SC485SL
- OP113FSZ-REEL7 假接地发生器的典型应用
- XL4005-12V5A V2
- 10MB/s 多协议芯片组支持 Net1 和 Net2 标准,使用 LTC1543 控制器可选 DCE 端口和 DB-25 连接器
- 使用 Analog Devices 的 LTC7851EUHH-1 的参考设计
- LTC3807 的典型应用 - 具有 24V 输出电压能力的低 IQ、同步降压型控制器
- XL4016可调恒压恒流实验电源
- XL6019可调电压模块
- FX-PSF-B04-AF-HMI
- MPC8XXFADS,基于 MPC860T MPU PowerQUICC MPC8xx 处理器的参考设计板
- 100A电流检测模块