用于蓝牙低功耗遥控器的语音命令

发布者:龙腾少年最新更新时间:2018-07-11 来源: eefocus关键字:蓝牙低功耗  遥控器  语音命令 手机看文章 扫描二维码
随时随地手机看文章

引言

 

最初,电视、机顶盒和空调等电器仅需少量控制功能[1]。在大多数情况下,开/关按钮、几个选择按钮和两组增加/减少控制足以完全控制您的设备。

 

但随着设备支持的功能增加,用户使用的命令和配置选项也随之增加。然而,用户仍希望只用一个遥控器来管理所有功能。为了解决这个问题,工程师们开始整合更复杂的用户界面(UI)。分层菜单出现在电视屏幕上,而越来越多的按钮被填充到遥控器中,以便用户调用和浏览菜单。

 

今天的重要趋势是让设备更“智能”。智能设备可以连接到其他设备和互联网,来提供更多功能和服务。使用菜单浏览,并用遥控器上的小按钮键输入一大字符串是不切实际的,也不是个愉快的体验。

 

在本文中,我们将讨论如何使用语音命令来提供更好的用户体验。我们特别研究了使用Dialog基于DA14585的高级语音遥控参考设计,通过蓝牙低功耗(BLE)实现语音命令。

 

图1较大的 QWERTY遥控器

 

用语音作为命令界面

 

语音是一个非常强大和直观的界面。一个简单的短语可以包含足够的信息来描述非常复杂的命令。然而,在嘈杂的环境中捕捉短语并提取有实际意义的信息(通常以字符串的形式),这在技术上是一个挑战。幸运的是,产生这个需求的源头,即智能设备与互联网的连接,也为这一复杂问题提供了解决方案。设备现在可以访问云计算,并且可以受益于最先进的语音到文本识别引擎,如Nuance Communications、微软、谷歌、亚马逊等公司提供的技术。如今,基于云的语音识别服务足以提供非常好的用户体验。

 

我们为什么还需要遥控器呢?

 

其实,不断监听语音命令的解决方案很早就开发出来了,设备可以不断地收听周围的声音并搜索命令。但是,背景噪音和用户与麦克风的距离问题,使得难以正确识别信息。此外,设备和云服务之间交换的数据量非常巨大,语音识别引擎面临大量的请求,其中大部分是不相关的。环境声音的不断记录也带来了严重的安全和隐私隐患。

 

我们需要一种触发器,一般通过按钮、手势或可识别的单词或短语来实现。这种解决方案适用于用户和设备距离很近,例如智能手机。但要在智能电视、机顶盒和用户离设备较远的其他应用中,正确识别触发信号并提供良好的用户体验就要困难很多。麦克风需要靠近用户,不是有遥控器嘛。那么将麦克风嵌入遥控器就再自然不过了。

 

量化语音识别要求

 

简单来说,语音命令功能的挑战可以表述为:“捕获'足够'的高质量语音记录,将其发送到语音识别引擎,然后处理文本结果以得出用户的命令”。这个短语包含两组基本要求。首先是需要触发器。实际上,需要两个触发器:第一个指示命令的开始,第二个指示结束。

 

第二组要求与音频信号本身有关。语音记录应采用适合引擎处理的格式进行编码,而且质量要“足够”好。质量“足够”好怎么定义呢。安卓兼容性定义文档[2]介绍了有关音频捕获质量指标的一些想法。

 

频率响应应该在100 Hz到4000 Hz的语音频谱上几乎保持平坦(+/- 3 dB)。这是描述窄带语音信号的众所周知的规范。关于麦克风产生的信号电平,安卓兼容性指南定义了声功率级-RMS图中的单点,以及线性跟踪声功率级的范围。

 

在1 kHz时声压级(SPL)为90 dB的声音,对于16位PCM信号,应产生2500的RMS。这几乎是16位有符号信号整体振幅范围的10%。想要感觉一下SPL范围的话,正常水平的电视机或典型的人类对话能在1米距离内产生60 dB SPL。相比之下,柴油货车在10米距离处产生90 dB SPL。

 

图2. 声压级示例

 

当然,我们不能期望用户在随时想使用语音命令的时候,都能把麦克风放在精确的位置并以特定的音量水平说话。鉴于PCM振幅水平可以线性追踪变化,语音识别引擎可以在一系列不同的声压级工作。要求至少30 dB的范围。从90 dB SPL点开始,麦克风应至少从-18 dB至+12 dB进行线性跟踪; 因此在+72 dB SPL和+108 dB SPL之间。这相当于将麦克风放在离嘴0.8厘米至25厘米之间,并以正常强度说话。

 

图3. PCM到SPL坐标图

 

语音识别引擎似乎对非线性行为比较敏感。对于麦克风上90 dB SPL输入电平的1 kHz正弦波,总谐波失真应小于1%。降噪处理、自动增益控制(如果存在)必须禁用。

 

其他要求

 

过去曾使用过无线音频协议的人,通常比较怀疑使用面向数据的协议来传输语音命令,例如蓝牙低功耗。

 

传输语音命令与传输实时音频或人声(如电话交谈)略有不同。由于用户不必回听他们的声音或保持对话,所以延迟要求可以放宽,因为固定的和一定范围内的延迟是不可避免的。但是,数据丢失要求是很严格的,因为缺少音频片段可能使语音识别引擎无法成功提取用户的初始信息。当然机器可以要求您重复这条信息,但这不是人们想要的体验。

 

构建语音命令遥控器

 

现在我们看看语音命令遥控器的架构,我们将按照通过系统的音频信号的路径来看。在这个过程中,我们将着眼于在实现经济有效、功率效率高的语音遥控器时经常遇到的挑战,以及可能的解决方法。

 

图4. 典型的语音捕获信号路径

 

一切都从音频捕获子系统开始。这可以基于不贵的模拟麦克风和编解码电路,或数字麦克风,将样本数字化并根据已知的串行协议进行传输。

 

对于电池供电的系统(如语音命令遥控器),将功耗降到最低至关重要。因此,强烈建议对麦克风或外部编解码器等外部元件的电源进行功率门控。

 

音频采样率必须至少为8k Samples / s以满足4 kHz音频带宽要求。但是,每个采样至少16位的16k Samples / s是更常规的选择。采用16位采样可确保足够的声压级范围,从而捕获的音频信号将包含足够的信息,以便语音到文字的识别工作正常进行。

 

采样音频涉及中断或某种形式的硬件 DMA,以获取采样并将其传输到缓冲区。该缓冲区需要将严格定时的音频采样与随后的音频处理解耦。对于低成本设备,音频处理由服务应用程序的相同处理器处理,在某些情况下由BLE协议栈处理。因此,缓冲区的大小将取决于音频处理模块接入CPU、处理音频数据并将其移至下一步所需的最大预期时间。典型的时间在几毫秒内。对于16位16k Samples /s信号,每毫秒产生32个字节,160-200字节缓冲器一般足以允许5毫秒以内的处理时间。

 

音频处理模块实现简单的音频处理,并对音频数据进行编码以降低其总体速率。音频处理包括非常基础的滤波,如直流偏移消除或带通滤波,和固定增益以优化音频振幅。原始音频数据为256 kbit / s,可以通过BLE进行有余量地流数据传输。为了降低速率并更好地利用带宽,使用已知的音频压缩算法对音频进行编码。编码器的选择比较多样,从简单的固定速率有损编解码器(如IMA-ADPCM),到复杂的处理密集型固定或可变速率算法(如OPUS)。简单的编解码器可以在MIPS容量较低的CPU上运行,但在相同的输出比特率下,生成的音频流质量较低。另一方面,复杂的算法可以提高编码音频流的质量,但需要较贵且耗电较多的CPU。

 

编码器的输出包含需要通过无线传输的最终有效载荷,并且需要一个额外的缓冲器来帮助均衡即时RF数据速率与编码器的平均输出速率。编码器的输出速率等于采样音频速率除以实现的压缩比率。下面的表格显示了Dialog的语音遥控器(Voice RCU)参考设计支持的典型原始和编码音频速率。

 

表1. 原始的和 IMADPCM 编码的音频

 

BLE是一种基于数据包的协议,在特定时间点交换数据包,由定期连接间隔分隔开。如果干扰在会合点期间发生使数据包失真,则数据将在下一个数据包中重新传输。每个连接间隔都发生在不同的频率通道中。通常,一个频率范围内会经常出现干扰信号,使多个连接事件失真并显著降低带宽。

 

BLE提供了一种叫做信道映射更新的机制来解决这个问题。主设备将检测受影响的频率范围,并实施信道映射更新程序。在此之前,BLE连接可能会经历RF数据速率的显著下降。编码器输出端的缓冲区的大小应相应调整,以便能承受此类事件。大小调整可以使用超安全方法,例如缓冲完整5秒钟信息需要40k字节,或者以一半的速率进行5秒钟的缓冲,而不丢失任何数据,这需要20k字节的缓冲。考虑市场上可用的设备,这是一个非常难以满足的要求。大多数设备的整个协议栈和应用程序都只有20 - 40 kbytes的总可用RAM。这个资源不能浪费在单个缓冲区上。需要注意是,缓冲区的大小与编码器输出速率和确保数据不丢失的时间成正比。

 

市场上已经提出了很多种技术,可以单独使用或组合使用来解决这个问题,而无需很大的缓冲区。在流传输音频样本时增加RF输出功率,以尽可能减少干扰;快速微调信道映射;使用更复杂的编码器来降低所需的RF数据速率,或者甚至在检测到明显的RF带宽下降时动态地降低质量。每种技术都会以牺牲某些其他资源(如能耗、CPU占用或音频质量)的代价来处理问题,而不是使用更多的RAM。

 

根据所使用的编码器算法,可以将数据存储为连续流或预定义了长度的数据包列表。为了更好地利用BLE带宽,最好将数据视为未经编码器分包的数据流。BLE传输的无损性质确保我们始终能够在遥控器上重建我们的初始数据流。多个BLE连接参数 -- 连接间隔、ATT_MTU大小、数据信道PDU大小和连接事件长度 -- 会影响BLE数据包的理论最佳大小的选择。在运行时,实际的错误率可能需要进一步优化数据包大小。由于消除了遥控器响应和数据包之间间隙所需的时间,使用大一些的数据PDU可以有效地使有效数据速率加倍。另一方面,单个数据包的传输时间延长,增加了在传输数据包期间发生错误的可能性以及重传成本。在严重无线污染的环境中,使用小一点的数据PDU可能会比使用已沟通的最大协议数据单元更有效。

 

所有这些要求决定了智能模块的出现,智能模块将数据从编码流中提取出来,根据连接特性打包数据,并将其推入BLE协议栈,同时监测实际BLE数据速率和错误率。打包器还应具有某种形式的仲裁和流量控制,以避免过多数据涌入BLE协议栈,并为其他应用保留足够的带宽,以便在音频传输过程中使用BLE进行数据交换,以确保设备不会无响应。

 

Dialog先进语音遥控解决方案

 

为了让设计人员能够评估功能完整的语音命令遥控器的性能,Dialog提供了基于单个DA14585 蓝牙低功耗(BLE)SoC的先进语音遥控参考设计。该设计不仅支持语音,还支持一系列附加功能,如无线鼠标、触摸板、红外线以及按键,这些功能都存在于现代遥控器设计中,为用户提供更自然的方式与终端设备进行交互并浏览菜单和结果。

 

图5. Dialog 语音遥控器开发套件

 

第二代参考设计包括整个软件架构的重要变化,更加模块化、更易于适应最终产品要求。所有的功能都被组织成模块,具有平台相关和独立的部分。这些模块连接到驱动程序,用于DA14585内部外设或为Dialog先进语音遥控开发板选择的外部元件。

音频路径是根据前面介绍的原则构建的。

 

图6. Dialog语音遥控解决方案的系统架构

 

为了提高音频质量,该设计采用了数字麦克风。对于成本敏感型应用,PDM麦克风比I2S / PCM会更适合。DA14585的集成PDM-PCM转换器将高频PDM信号转换为24位音频PCM采样,并通过专用DMA信道将其传送至存储器缓冲区。

 

M0 CPU执行音频处理和流传输模块。从主循环中,调用一个预处理模块来应用直流阻断和24位至16位的转换。如果需要,下采样单元可以将音频采样率从16k Samples / s减少到8k Samples / s。音频预处理单元的结果被馈送到IMA ADPCM编码器。根据配置的不同,编码器会为每个16位音频采样生成一个4位或3位采样。

 

图7. Dialog语音遥控解决方案音频路径

 

作为设计选择,该参考设计支持自适应音频速率机制,以防止可能的缓冲区欠载。音频采样的采样率和/或IMA ADPCM编码器的配置可随时更改,从而可以在不同的输出速率之间切换。为了支持这种机制,已经开发了带内信令机制。编码器的输出和带内信令共享同一个的数据流缓冲区。

 

打包器模块收集来自数据流缓冲区的数据,并高效地将它们推入协议栈,同时尽量不溢出。除了考虑连接参数外,打包器还密切监测错误率和瞬时可用带宽。这有助于其在自适应音频速率机制启用时,做出是否降低或提高音频质量的决定。

 

所有策略,如使用固定或自适应音频速率,音频开始和停止的方式,均由用户或远程设备控制。单独的缓冲区大小都是配置选项,因为根据最终应用的不同,可能适合不同的用户体验。

 

结论

 

将设备连接到互联网的能力,与现代基于云的语音识别服务相结合,实现了强大的新用户界面 - 语音命令。智能手机、智能电视和机顶盒已经在使用语音命令。通过将低成本的麦克风集成到BLE连接的外围设备中,用户的语音识别体验可以大大增强。从遥控器、智能手表和可穿戴设备收集的命令,通过智能设备传输到云中的语音识别引擎,可以控制智能设备本身以及与智能设备相连的外围设备或由语音助理控制的其他设备。


关键字:蓝牙低功耗  遥控器  语音命令 引用地址:用于蓝牙低功耗遥控器的语音命令

上一篇:家电消费市场潜力爆发,智能制造成发展趋势
下一篇:HomePod是否能成为智能音箱市场的“iPhone”?

推荐阅读最新更新时间:2024-05-03 03:05

联发科技推出MT7697,支持家用物联网低功耗蓝牙和双频WiFi
联发科技(MediaTek Inc.)今日宣布推出家庭物联网方案MT7697,进一步提升联发科技在家庭物联网芯片市场的领导地位。联发科技的家庭物联网芯片方案具备高集成度和超低功耗等优点,非常适合家用电器、家庭自动化、小型智能设备、物联网设备的桥接器(bridges)与连接云端服务等多种应用。 为小型智能设备和可穿戴设备所设计的MT7697支持Wi-Fi和蓝牙连接。这款芯片与联发科技丰富的智能手机芯片系列平台相互补足,为追求处处互联生活方式的现代消费者搭建了一个可让智能手机、可穿戴设备及家用电器无缝连接的产品生态圈。MT7697可以非常灵活地在低功耗蓝牙和Wi-Fi间切换连接,其中蓝牙适合短距离范围内的连接,而Wi-F
[网络通信]
可运行低功耗蓝牙兼容性好的nRF52840 SoC
Nordic Semiconductor 宣布智能手机和电子产品巨头小米的企业生态系统成员深圳绿米联创科技有限公司已经选择 Nordic 的 nRF52840 Bluetooth®5.2/ 低功耗蓝牙 (Bluetooth® Low Energy /Bluetooth LE)先进多协议芯片级系统(SoC),为其“ Aqara 智能门锁 N200”提供无线连接功能。 这款智能门锁用于家居安全应用,可为多个授权用户提供即时无匙门禁功能。安装之后,Aqara 智能门锁 N200 可以通过与 iOS 和谷歌兼容的小米“米家”或与 iOS 兼容的苹果“Home”应用程序,与用户的蓝牙 4.0 (及更高版本) 智能手机或平板电脑配对,并进
[嵌入式]
可运行<font color='red'>低功耗</font><font color='red'>蓝牙</font>兼容性好的nRF52840 SoC
自学习红外遥控器的设计与实现
    红外遥控在家电产品中有广泛应用,但各产品的遥控器不能相互兼容,目前市面上常见的万能遥控器只能对某几种产品进行控制,不是真正的“万能”。本文利用单片机对遥控器的发射信号的波形进行测量,然后将测量的数据回放,由于只关心发射信号波形中的高低电平的宽度,不管其如何编码,因此做到了真正的“万能”。 1 发射信号波形的测量   所有红外遥控器的输出都是用编码后的串行数据对38kHz~40kHz的方波进行脉冲幅度调制而产生的。如果直接对已调波进行测量,而其脉宽只有20多微秒,由于单片机的指令周期是微秒级,会产生很大的误差。因此,先要对已调波进行解调,对解调后的波形进行测量。   用CX20106对已调波进行解调,原理图如图1所示。
[嵌入式]
低功耗蓝牙胎压监测系统为驾驶员保障行车安全
70迈公司的70迈胎压 监测 仪采用Nordic的nRF51系列SoC器件以实现车载控制台和用户智能手机的无线连接   挪威奥斯陆 – 2018年9月18日 – Nordic Semiconductor宣布小米生态链公司70迈已选择Nordic的 低功耗蓝牙  (Bluetooth® Low Energy /Bluetooth LE) nRF51系列系统级芯片(SoC)为其“70迈胎压监测仪”提供低功耗蓝牙无线连接。这款系统针对车辆轮胎压力提供低延迟连续反馈,允许用户在胎压出现异常的情况下采取纠正措施,以保障 行车安全 。   每个车轮的轮胎气门杆均安装了压力传感器,在操作时,每个传感器采用433MHz无线传送器将胎压数据持续传递
[嵌入式]
红外遥控器的接收实验
遥控发射器专用 芯片 很多,根据编码格式可以分成两大类,这里我们以运用比较广泛,解码比较容易的一类来加以说明,现以日本 NEC 的uPD6121G组成发射 电路 为例说明编码 原理 (一般家庭用的DVD、VCD、音响都使用这种编码方式)。当发射器按键按下后,即有遥控码发出,所按的键不同遥控编码也不同。 一、电路实现 红外发射器很容易找到,我们平时家用的电视、DVD遥控器都可以用来进行实验。下面的 电路图 是红外接收部分的电路图, 二、红外接收原理 关于红外发射部分,由于我们采用的是现成的遥控器,而不同的遥控器其实现电路各不相同,这里我们就不详细介绍。我们只需要知道遥控器发射出来的 数据 格式,然后通过红外接收器接
[单片机]
红外<font color='red'>遥控器</font>的接收实验
大联大世平集团推出基于ADI无线技术远距离航模遥控器方案
2017年3月7日,致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下世平推出基于亚德诺半导体(ADI)ADF7242 2.4GHz的无线大功率航模遥控器方案,该方案可提供长达2公里的远距离无线操控,主要应用在无线遥控器、航模、远距离无线数据传输等诸多领域。 随着信息技术的发展和对高速无线通信的需求,无线应用产品的工作频率范围从低频段进入高频段,而全球皆无需经过授权即可使用的2.4GHz工业、科学及医疗用(ISM)频段目前已经成为许多高阶无线产品的首选频段。ADI的ADF7242是一款高度整合的低功耗、高效能收发器,其设计兼具灵活度、稳定性、易用性和低功耗等特性。该收发器的市场应用范围非常广泛,例如无线传感
[半导体设计/制造]
大联大世平集团推出基于ADI无线技术远距离航模<font color='red'>遥控器</font>方案
芯片商竞推SoC方案 蓝牙低功耗市场战火炽
    蓝牙低功耗(Bluetooth Low Energy)晶片市场战况日益激烈。看好智慧配件(Appcessory)市场成长商机,包括博通(Broadcom)、ROHM集团旗下的LAPIS半导体、意法半导体(ST)、赛普拉斯(Cypress),以及戴乐格(Dialog)半导体等业者,皆竞相于今年推出蓝牙低功耗系统单晶片(SoC)解决方案,让市场竞争战火急遽升温。 Nordic产品管理总监Thomas Embla Bonnerud强调,nRF51系列蓝牙低功耗SoC具备创新的硬体与软体架构,为该公司拓展智慧配件市场的重要利器。 Nordic产品管理总监Thomas Embla Bonnerud表示,愈来愈多半导体厂已开始体认到蓝牙
[手机便携]
三星SDS推出先进的低功耗蓝牙智能门锁,用户可用手机监控
智能门锁是智能家居的一个发展热点。近几年,各种指纹锁、人脸识别门锁纷纷走入大众的日常生活中,成为家装的新宠。其中,智能蓝牙门锁是其中一个热门产品类别,特别是中国投资超过1,500亿美元建立世界领先的家庭自动化行业,大力推动了市场增长。 近日,超低功耗(ULP)射频专家Nordic Semiconductor宣布以韩国首尔为基地的跨国三星集团的子公司Samsung SDS在其SHP-DP930智能门锁中选用Nordic屡获殊荣的nRF52832低功耗蓝牙 (Bluetooth® Low Energy /Bluetooth LE)系统级芯片(SoC)。 这种“推拉式”智能门锁是三星SDS面向亚洲和大洋洲地区的智能门锁系列中的
[物联网]
三星SDS推出先进的<font color='red'>低功耗</font><font color='red'>蓝牙</font>智能门锁,用户可用手机监控
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved