“毫不夸张,自从入手这款灯,我的手再也没有摸过家里的开关。”在一款语音灯的评论区曾有人这样留言。该款语音灯具是某品牌今年的主推款之一,“实用、很方便”是其主要标签。
语音作为人工智能代表性的交互方式,正从科幻电影中神秘的高科技走向大众百姓,在万物互联时代,掀起新一轮的“热潮”。
语音替代遥控器,却不止于此 Part.1
语音为家电行业带来的第一重改变即“语音替代遥控器”, 例如采用探境AI语音方案的空调产品,无需联网、插电即可直接使用,说句话就能实现开关、模式、温度等功能的调节,让用户解放双手,不用再特意寻找空调遥控器。
然而,探境科技在对于语音人机交互进行深入洞察之后发现,语音交互对于家电行业,并不仅是对遥控器功能的复刻这么简单粗暴,还有更深远的颠覆性意义,例如通过语音调节档位,减少用户的繁琐操作。
以上文提到的语音空调为例,当空调温度为18℃时,用户想调整到28℃,使用传统的空调遥控器要重复按10次,而如果采用语音操作,只需说一句“28度”即可实现调节。将多档位的温度、湿度等调节,从用户端转交由空调的后台来设置和执行,大大简化了用户端的操作步骤。
放眼全屋家电产品,受档位限制的产品远不止空调一个品类,饮水机、破壁机、洗衣机、空气炸锅产品等亦是如此。有了语音之后,出水量、制作时间、加热度数、旋转频率等,皆可一词直达,不必再使用时多次重复操作。
以饮水机为例,传统饮水机或茶吧机,这类家电产品外观上通常会带有按钮或触摸选项,受自身体积空间限制,不可能将所有档位都标在上面。这无疑大大限制了产品自有功能的使用价值。而语音款的饮水机或茶吧机,在水量、温度等方面有更细腻的颗粒度供用户选择。
传统饮水机/茶吧机VS智能语音型产品 用户操作做减法,生活品质做加法 Part.2
深入到底层产品设计之后,敏锐的产品经理也许能够觉察到,语音还有另一重深意,那就是可以设置多种“模式”,一词直达所需,让用户彻底实现“傻瓜式”智能。
例如,空气炸锅是厨房里很常见的一个小家电产品,不同美食的制作时间和所需温度有所不同,用户在使用传统空气炸锅时,通常要翻看说明书再手动调节。
而具有语音功能的空气炸锅只需要用户说出烤制食物的品类,如烤鸡翅、烤红薯等,即可完成操作。一句话直达食材品类,这一功能看似只解放了用户的双手,避免繁琐的操作步骤,事实上,对于那些不具备丰富的烹饪知识或对家电底层操作逻辑不熟悉的用户来讲,减少了不必要的学习成本。
“温度+时间”、“水量+温度”、“电机转速+时间+温度”,事实上,现实生活场景中需要这类组合型操作的小家电不胜枚举。
破壁机可以设置果蔬模式、豆浆模式、米糊模式等,饮水机可以设置奶粉模式、红茶模式、绿茶模式等,不同的食材或饮品需要不同的功能组合。通过模式设置,繁琐的操作步骤,从用户手中变到产品内部程序执行。
生活中,另一个与场景设置息息相关的是照明产品,传统的机械开关按钮仅能实现灯具开关控制,即使是多开的墙壁开关,对于色温变化等也需要反复操作,且也不具备灯光无极调节功能。
语音直达场景及代表模式
而通过语音控制灯具,除了开关功能,可通过“色温+亮度”的调节实现阅读模式、夜灯模式等多种模式调节,“照明模式+时间”的组合,还可以设置“番茄钟”,在番茄钟设定的时间范围内,采用学习模式,光线有利于孩子集中精力,专注于完成自己的事情,当学习时间结束,便可以休息5-10分钟,同时光线会切换到休闲模式。
“AI语音方案的历史使命就是赋能家电厂家,只有深度的场景洞察才能为家电厂商提供‘量身定制’的方案,不夸张的说,‘场景洞察’能力,是一家AI语音芯片公司安身立命的本领之一。”探境科技CEO鲁勇这样强调。
家电行业观察家、《科技有马》创始人马聪先生认为:语音交互对于家电行业的升级可以分为两部分:一是外观层面,去掉多余的按键或按钮,这无疑将提升家电产品的美观度,同时也对家电设计师提出了新的挑战。第二部分的升级是交互层面,就像触摸屏之于智能手机,对于整体交互逻辑的颠覆,语音也将改写家电行业的交互历史。
对于产品经理而言,需要从语音的功能出发,基于用户需求的升级,而非基于功能叠加的升级,让产品更懂用户,更具易用性。两个部分的升级有助于商家研发崭新的家电品类,增加用户的使用频率,提高的产品的存在感和价值感,从而成为了产品的价值放大器,促成了家电行业的升级。
中国家电网总编吕盛华表示:目前很多语音智能技术还停留在简单的语音对话阶段,对于产品更深层次的场景交互认知还远远不够。一个划时代交互界面的升级,对于一个产业而言,往往意味着从单个典型产品,到多个同类产品再到整个行业的多重颠覆,语音功能亦然。在这个逐渐明显的趋势之下,只有善于拥抱时代浪潮的企业才能破局而立,引领时代。
端侧语音方案 助力家电自主智能 Part.3
工欲善其事,必先利其器。
在厘清语音对于家电的作用之后,选择哪种语音方案便是紧随其后的问题。传统的语音交互的技术路径其实可以拆分为三部分,即“人”+“云”+“家电”,其中,云成为必不可少的环节,这就导致在语音交互的实现过程中,必须依赖于第三方中控,用户需要联网、下载APP、配置等多项复杂操作才能完成操作,厂商更要解决生态不兼容、云平台及APP开发等问题。
用户语音交互的路径冗长,无疑会影响语音家电的落地速度。而探境端侧AI语音方案则能够在本地接受内容之后直接处理为结果,实现高效率的边缘计算,从而帮助家电企业摆脱的“云”的桎梏,也摆脱了因为“云”而产生种种冗余的设备和操作,实现了家电的自主智能。
端侧方案与云端方案技术路径对比
相比之下,探境的端侧语音方案无需网络配置,无需要开发APP、也无需考虑生态环境,通电即可使用。据鲁勇介绍,当下很多语音芯片为了片面地追求识别率,特意把一些阈值调低,但是这会导致误唤醒率很高,因此唤醒识别率和误唤醒率是一对不容易协调和平衡的指标,而探境科技却做到了最佳的一个指标组合。语音识别率能够达到97%,而误唤醒率为72小时少于1次的程度,将智能家居的人机语音交互提升到一个新的水平。
数据来自探境科技语音测试报告
能够实现如此精准的识别效果,要基于高算力语音芯片,探境自研的存储优先架构(SFA架构)专门针对AI行业存储墙问题而设计,直接针对神经网络计算中高并发、高耦合、高差异“三高”特性出发,推翻了冯诺依曼体系,不同于之前的类CPU架构,以存储来驱动计算资源,数据在搬移过程中就完成了计算,计算对于数据来说只是一种“演变”,可实现存储、计算、调度一体化。
在SFA架构下,无需昂贵的HBM总线及大容量片上存储,仅依靠标准工艺单元设计,也能获得超低功耗超高性能的AI计算。
强大的AI语音方案,离不开芯片与算法的高度耦合。探境科技将AI应用于传统音频算法,可提高系统兼容性,降低硬件资源的需求;麦克风阵列信号的AI处理算法,可做到唤醒率、识别率高,进一步加强识别算法的抗干扰能力;基于AI的降噪算法,可以有效抑制各种噪声,特别是传统算法不能很好处理的非稳态噪音;基于端到端语音识别算法,网络的表征能力更强,对环境噪声、混响条件、口音语速的适应能力更强。
尤其值得一提的是,探境自研的端侧NLP(Natural Language Processing,自然语言处理)方案亦已开始落地。端侧NLP让自然语义从云端下移到了端侧,用户与家电之间的交互就像日常对话,既操作简单,又交互自然。鲁勇坚信:随着AI语音模型的轻量化,以及端侧芯片算力的逐步提高,端侧NLP语音方案最终将走向千家万户。
对家电厂商而言,探境的端侧语音为元器件级别的改造,直接从生产端切入,降低了产品间的转换成本,亦可覆盖几乎所有的家电品类。当前,不少客户亦与探境达成深度合作关系,进入批量出货阶段。在探境落地的诸多实例中,终端用户对端侧语音都有着极高的接受度,尤其是曾被忽视的老年群体。
探境端侧语音方案覆盖众多场景
经过数十年发展,多数传统家电产品已进入存量市场竞争阶段,在科技创新愈发迅猛的跑道上,语音技术的影响力不言而喻。当市场端与生产端的瓶颈被端侧语音击破,笼罩在家电厂商的阴霾终将消散。就像功能机取代智能手机,当下更需抛开思想的“桎梏”,理性分析、找对方向,为用户带来极致、便捷的体验,在智能化转型的大浪淘沙中留存下来。
- 使用 Analog Devices 的 LTC3602IUF 的参考设计
- LT3489 的典型应用 - 具有 2.5A 开关和软启动的 2MHz 升压型 DC/DC 转换器
- 具有 I2C 接口的 LTC2606IDD-1 16 位轨至轨 DAC 的典型应用
- ESP32-S3开发板
- ADR420 超精密、低噪声、2.048V XFET 输出电压基准的典型应用
- 用于便携式消费电子产品的 2 通道 D 类音频功率放大器
- 使用 ON Semiconductor 的 NCP5666 的参考设计
- ETRX2-PA 和 ETRX2HR-PA ZigBee® 模块产品手册
- LT6657AHMS8-5 具有电流限制的升压输出电流的典型应用电路
- LT3663IDCB、1.2V 降压转换器的典型应用