端侧方案为什么成为语音芯片“必杀技”?

发布者:qin199099最新更新时间:2021-01-17 来源: 爱集微关键字:语音芯片 手机看文章 扫描二维码
随时随地手机看文章

未来物联网勾勒的美好画卷正徐徐展开,而成为主驱动力的智能家居正躬逢其盛。而在所有打开智能家居大门的“钥匙”之中,语音俨然成为最大热门。据ReportLinker预计,到2024年,全球智能语音市场规模将达到215亿美元。

然而,如果将语音等同于智能音箱,那当是谬以千里。智能音箱作为中控设备只是语音的一个入口。从客厅到厨电、卫浴等应用场景的任意家电产品,语音其实可以脱离音箱实现“单机智能”,而语音芯片,正是其赋能者。

打破固有思维 语音≠云

尽管一提到语音方案,业界的惯性思维大都集中在联网上云的层面,但其实上,应用只有深入到细分市场需求层面,才会激发新的洞察。

探境科技CEO鲁勇,曾深入剖析语音在智能家居产品的需求。以大家常见的互联网电视为例,技术路径一拆为二,一个是语音识别环节,获取用户的指令,另一个是内容获取环节,执行指令获取云侧的影音。

再深一步剖析我们会发现,其实从智慧客厅到智慧厨房、智慧卫浴等细分场景的各类家电中,需要获取影音内容的仅有电视和音箱等极少数家电产品。像灯具、开关、空调等绝大多数的产品,或许会在某些高端产品线上附加此类功能,但并非刚需。

可见,智能家居的语音需求可分为两类,一类是通过语音获取内容,一类是通过语音控制家电。需要获取内容的家电品类并不多,其内容获取环节也与语音技术无关,影音内容的好坏取决于云平台上片源的质量。

而控制电器的技术路径,又可分为“远程控制”及“语音控制”两种。其中远程控制通过Wi-Fi或蓝牙等无线技术实现app联网,并进一步控制电器,其技术的关键节点在于云端联网,远程控制实际上就是控制功能通过联网来延伸。

可见,在智能家居领域,智能交互的最终目的就是为了控制家电设备,与其强相关的只有“语音控制”这一方向。

“语音控制”本身则可细分成“指令型”与“自然型”(即NLP自然语言处理)两种。“指令型”可通过离线来实现,也可通过在线来实现。而NLP目前主要是通过云侧实现。

“就像大家把云和语音强关联一样,其实很多人又把‘云’和‘NLP’两个问题混到了一块,认为自然语言识别就得上云。”鲁勇认为,未来随着算法模型越来越小、而芯片功能越来越强大,NLP实现离线识别将指日可待。

可见,语音识别并不等于云。语音识别和云计算是两个层面的事情,一个是具体的技术,一个是基础计算设施。语音识别技术的实施途径分为离线和在线两种,两者的区别是将计算放在端侧还是云端进行。

事实上,智能家居领域,离线语音方案有其特定的优势。

离线语音的普世之路

在不远的未来,万物互联将催生上亿台设备,如果所有计算都放在云端的话,不仅成本昂贵,而且效率难以保证。尤其是智能家居这一特殊场景,对实时性、稳定性及隐私性都有极高的要求。出于对云端数据处理能力、网络延迟及数据安全性的考虑,把算力“下放”到靠近终端的边缘计算将得到快速的发展。

如果说这是产品设计的考量,那么从生态链角度出发,对于广大的家电厂商而言,上云意味着或将流量入口或大数据开放给第三方的生态链公司,或自建私有云入口,既要考虑生态的兼容性,又存在一定的研发门槛,而端侧方案则不必考虑诸多顾虑,更可放手一博。

对于C端用户而言,离线语音带来的好处也是显而易见。用户无需购置和使用智能音箱等这类集中式控制硬件,也无需考虑不同品牌与云平台的兼容,亦无需要考虑私隐安全的问题。更重要的是,离线方案无需依赖网络、没有延迟、识别精准,从而降低了用户的使用门槛。

鲁勇认为,智能家居发展方向应当是“先实现智能,再考虑生态”,本该保证产品易用性的生态,不该成为制约用户使用的障碍。

离线语音使智能家电产品变得像USB一样,实现即插即用,没有任何使用门槛,这将从根本上提升最终的用户体验,大大打消终端消费者的使用顾虑。此外,离线语音可面向几乎所有的家电品类,让每一台家电都成为真正的智能化设备,让智能家居从小众产品变为普世产品。

正是凭借自身深厚技术底蕴与敏锐市场判断力,探境科技离线语音识别芯片——音旋风VOI611迅速打开了市场的大门。音旋风VOI611在市场上的竞争优势极为明显:支持200条命令词,拥有高达99%唤醒率与97%识别率,误唤醒率少于1次/24小时,响应时间小于0.2s,可做到10米远场识别距离,具有精准的识别效果。

此外,探境科技的语音芯片价格几乎与普通MCU持平,且没有任何研发门槛,这无疑将大大加快家电企业智能化的速度。

目前探境科技已覆盖的智能家居产品包括:智能灯具、智能开关、空调伴侣、语音风扇、空气净化器、晾衣架等多个品类,合作厂商包括美的、海尔、新颐、艾美特等知名企业。

同时鲁勇强调,端侧和云端,并不是非此即彼的单选题,在已有端侧语音方案实现单机智能的前提下,是否要联合Wi-Fi模组,或是增加云端识别,对于厂商而言不过是一道可以自由组合的多选题。

目前业界已意识到在线方案的诸多弊端,“离线+app”、“离线+云识别+app”这样的离在线方案已见苗头,鲁勇认为随着语音方案的算法模型越来越小,以及芯片性能逐步提升,端侧NLP的技术壁垒已可攻破。未来离线NLP技术成熟之后,更智能、可定制的离线NLP语音方案将是家电厂商的不二之选。

未来“芯”中有数

看准离线语音芯片的锚点,探境已然长线布局,取得初步研发成果。

2020年第四季度,探境科技内部代号为音旋风二代的芯片产品已流片成功。音旋风二代与一代相比,算力更强,可以运行更大的神经网络模型,同时功耗更低,价格也更低。此外,探境的端侧NLP产品也已现雏形。

凭借“存储优先架构”(SFA架构)解决存储墙这一独一无二的硬件架构,辅以打通语音识别全链路的算法精进,探境的语音芯片具有体验好、功耗低、性价比高、实用性等优势。

鲁勇提到,探境不仅可为客户提供芯片、算法、Turn-Key等多种语音方案,还支持客户进行二次开发,支持算法移植。在系统软件层面,对于不同的客户提供不同层次,包括指令集、SDK开发环境或应用层语音/图像算法,并可为客户个性化部署流程。

在鲁勇看来,无论任何产品都要尊重人性,人需要陪伴,需要情感交流,这也是探境的终极发展方向,而语音和视觉正是自然界中人类最便捷最符合人性的交互方式,探境科技不会单纯的追求某个AI技术指标,而是要做有温度的芯片方案,以AI技术推动生活。

“下雨时每一滴水会如何进入到山谷,这个路线是肯定无从了解的。但是你一定知道方向——因为有重力,所以必然向下。而类似于必然发生的「重力」,商业趋势也是必然的,总体趋势一定能够预知。”物联网之父凯文•凯利曾如此总结趋势的重要性。

在经过市场的锤炼之后,探境未来也将更加“芯”中有数。未来,探境秉持对市场的潜心洞察与剖析,加以硬件、算法的持续创新,也将迎来新的高光时刻。


关键字:语音芯片 引用地址:端侧方案为什么成为语音芯片“必杀技”?

上一篇:华尔街日报:苹果手机并未从华为战略收缩中获益
下一篇:凌云光拟科创板IPO 获小米长江产业基金/富士康等战略投资

推荐阅读最新更新时间:2024-10-31 11:52

玩具语音芯片,短秒数低成本语音ic方案,单音播放芯片,WTN6
在现今语音交互智能化时代,玩具也不再只是简单的机械结构和颜色鲜艳的外观设计。随着科技的不断进步,玩具也越来越智能化,语音芯片成为了现代玩具中不可或缺的一部分,能够刺激幼龄儿童的大脑语言功能; 但是,许多厂商因为高昂的成本而不使用语音芯片,这使得他们难以进入市场。为此,我们公司研发了一款低成本语音芯片——WTN6,以帮助更多的厂商进入这一领域,我们现有6s、20s、40s、80s、96s、170s,六种不同秒数选择,且搭载12位PWM/DAC输出引擎,可直推8欧0.5W的喇叭; 唯创知音WTN6低成本语音芯片的优势在于: 一、价格低廉 相比于市面上的其他语音芯片,我们的WTN6006-8S语音芯片,价格更加低廉,且性能优异
[嵌入式]
ISD4004语音芯片的工作原理及智能控制系统中的应用
    摘要: ISD4044是一种采用ChipCorder专利技术的语音芯片。此芯片无须A/D转换和压缩就可以直接储存,没有A/D转换误差,在一个记录位(BIT)可存储250级声音信号,相当于通常的A/D记录的8倍。片内集成了晶体振荡器、麦克前置放大器、自动增益控制等,只要很少的外围器件,就可以构成个完整声音录放系统。本文介绍了ISD4004的原理、特点、功能及其在智能控制系统中的应用。     关键词: ISD4004 单片机 89C51 1 概述 ISD4004是美国ISD公司制造的一种新款语音芯片。与ISD其它系列语音产品不同的是,ISD4004是一种微控制器“从”设备,而“主”控制器可以是内置有
[传感技术]
WT588F语音芯片在身高测量仪的应用
身高测体重测量仪,采用高精度传感器和语音操作界面,通过电子语音播报的方式,告诉用户如何进行操作,无需观看说明书即可实现,便捷性的操作,通过WT588F语音芯片,即可实现清晰播报测量结果、提示测量步骤的注意事项、声音大小可任意调试、且支持多国语言播报。 WT588F系列语音IC,是一款可重复烧写的语音芯片,采用SOP-8的封装形式,单芯片可存储170~320秒的语音内容,可直推8R0.5W的喇叭(PWM输出)也可以外接DAC功放输出,是低成本的语音解决方案; WT588F语音芯片,可以通过一线串口 或 两线串口的控制方式,采样率高达6K~32K,最大支持1000段语音地址,外围电路简单,通过配套下载器或MCU可实现在线更换W
[测试测量]
WT588F<font color='red'>语音芯片</font>在身高测量仪的应用
NV080D语音芯片在甲醛检测仪上的应用
甲醛对我们人的身体有严重的危害,它是一种没有颜色但是有刺激性气味的气体,虽然甲醛是有气味的,但是如果浓度过低也闻不到甲醛的味道,即使闻到了也很难分辨出来。因此使用甲醛检测仪检测甲醛含量是否超标是十分重要的。 NV080D语音芯片甲醛检测仪语音方案: 市面上大部分甲醛检测仪只用蜂鸣音提示,不知道测量结果的数据有多少,不能方便顾客判断甲醛的含量。而加入NV080D语音芯片实现真人语音提示功能,真人语音播放,更加人性化,通过传感器进行判断,可以在环境受到污染时播放语音并发出报警,广播当前环境的污染程度等功能,使人们更恰当地了解周围环境是否安全。 NV080D语音芯片甲醛检测仪词条内容(可定制): 1、欢迎使用XXX智能语音甲醛检
[测试测量]
NV080D<font color='red'>语音芯片</font>在甲醛检测仪上的应用
语音芯片烧录的关键三大要素
由于人耳听觉系统的复杂性、生理结构特异性让人们无法从生理解剖学的角度得到完美诠释。人耳对不同强度和不同频率的听觉范围统称为声域,人耳听觉的主观感受大致来源于响度、音高以及音色三种特性,也称声音“三要素”。这也是一般语音芯片烧录时音频定位的主要构成因素。 响度 响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。声音的响度一般用声压(达因/平方厘米)或声强(瓦特/平方厘米)来计量,声压的单位为帕(Pa),它与基准声压比值的对数值称为声压级,单位是分贝(dB)。对于响度的心理感受,一般用单位宋(Sone)来度量,并定义lkHz、40dB的纯音的响度为1宋。 响度的相对量称为响度级,它表示的是某响度与
[嵌入式]
<font color='red'>语音芯片</font>烧录的关键三大要素
艾灸仪语音芯片方案
艾灸是一种中医疗法,通过对人体特定部位进行热刺激来治疗疾病。艾灸有以下作用:首先,用艾绒制成的艾条在某一穴位进行艾灸,会产生一种温暖的感觉,所以可以温经散寒。其次,可以促进血液循环,疏通经络。 艾灸属于中医,中医治病的原则是三分治七分养,治的是病,养的是命,是以对身体最小的负荷,取得好的效果,甚至还能改善人的体质,让人少生病。 疾病面前,人都是实用主义的,而且现代人运动时间相对少了,而多功能艾灸仪可以是根据传统中医艾灸的原理,结合现代的电子计算机技术和磁疗方法而发明设计的,能够进行温灸、温针灸、隔物灸、发泡灸、化脓灸操作的现代艾灸仪器。 许多人都喜欢去养生会馆做艾灸,但事实上要排队,等很久,不仅花费大量的时间,而且去一
[嵌入式]
谈谈一颗语音芯片如何造就电饭煲市场的智能语音新时代
近两年,到日本扛电饭煲、马桶盖回国,成为一种社会现象,也是一个消费痛点。国产货掉队了,开始跟不上人们的消费需求,而这个痛点也同样刺激了国内某龙头家电企业董事长,他对国人去日本哄抢电饭煲的这一现象感到非常遗憾和痛心,认为我们这么一个制造大国没有理由造不出让国人心动的产品,更没有理由做不好一个电饭煲。于是,该家电企业不断刻苦研发,推出了又一力作——智能语音电饭煲。 此款产品最突出的不仅仅是使用电磁加热技术,让每一粒米在立体加热情况下更加香甜软糯,而且突破传统思维,携手国内具有创新能力的智能语音芯片厂家—深圳唯创知音电子有限公司(原广州唯创电子有限公司),使用优质的WT588D/WTV/WTH语音芯片,并采用标准的真人录音,开创智能语音
[嵌入式]
小广播
最新手机便携文章
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved