智能家电一定要说话?

发布者:masphia最新更新时间:2018-08-11 来源: eefocus关键字:智能家电  人工智能 手机看文章 扫描二维码
随时随地手机看文章

随着移动互联网和人工智能的发展,基于语音的交互已经越来越重要、也越来越普及,从目前技术水平来看,在安静环境、标准口音、常见词汇上的语音识别率已经超过95%,完全达到了可用状态,由此也奠定了语音交互功能被广泛应用在包括智能手机、智能音箱、智能家电等等各种各样设备中的技术基础。

 

在线语音交互痛点:依赖网络和延迟大

不过,目前语音交互技术的使用还是离不开网络和云端。从技术层面上看,一个完整的智能语音交互闭环的系统,包括语音信号采集和预处理(降噪、回声消除)、后端语音识别、自然语音处理(理解、决策、表述)、语音合成等各个模块。其中语音识别到语音合成过程需要较大的数据量和计算量,往往会被放到云端去处理。

 

无论是现今市场火爆的智能音箱还是各大家电厂商推出的智能冰箱、智能电视,采用的是语音交互大多数都是上述这种在线语音交互方案,所以设备在使用前往往需要借助智能手机将智能音箱连接网络。深圳市木瓜电子科技有限公司技术支持工程师邱松晓指出,在智能家居、智能硬件中使用语音交互,替代遥控器,可以解放用户双手,带来很多便捷性,但是,目前使用在线语音交互功能还需要先解决一些现有存在的缺点。

 

 

“在线的语音交互依赖于云端去处理,设备的前端往往只做声音的采集、回声消除和噪声抑制等处理后,就通过网络送入云端做语音识别和处理,处理后的结果又在通过网络返回回到设备中,这其中就有产生两个问题:首先,一旦网络出现问题,语音交互功能就很有可能瘫痪;其次,就算在网络状态好的情况下,设备的响应速度还是不尽理想,举例来说,前端语音处理约50ms,通过网络需要约100ms,云端处理约500ms,还有延迟,再返回,加起来估计是1S到2S,特别是国内的网络不稳定的情况下,有可能时间会更长。”

 

“此外,在线语音交互方案往往需要一个唤醒词,在说出唤醒词,等设备做出相应的回应后,才可以开始与智能设备对话,体验不是很好。” ”邱松晓说到。邱松晓和其公司一直在从事语音交互技术方案的开发,也给客户做过不少在线语音交互的方案,不过目前,他们也把不少精力放在一种更为简化的离线语音方案上。此模块方案可以实现单麦远场语音拾取、语音唤醒、回声消除、智能控制及语音播报等功能。

 

离线语音方案优势在于实时和成本

离线语音方案,顾名思义就是语音识别处理在本地,并不需要上传到云端去处理。“以控制空调为例,我们先将‘请开空调’、‘调高一度’等命令词经过算法训练和模型匹配后固化在本地存储中,当进行语音控制时不需要联网,在本地存储直接调用。”邱松晓说到,“相比在线方式,离线的方式确实有局限,这类方案更多属于控制型的,不是交互型;而且由于本地的存储空间有限,不像在线方案是通过云端处理,所以命令词确实会比在线的少,一般命令词条在几十条左右。”

 

集成了离线语音模块的设备可以通过语音来控制执行一系列的操作指令,不过只是不能像智能音箱一般进行查询天气、新闻、讲故事、对话等交互。在智能音箱等在线语音方案如此火爆的情况下,木瓜电子同时也选择了做离线方案,除了考虑到前面提到的在线方案的不足外,其实更多是市场真正需求的使然。

 

一方面,包括亚马逊、京东、阿里、腾讯等都推出了智能音箱,用智能音箱控制和连接家电,希望想通过此类产品抢占智能家居入口;另一方面,各大家电巨头也纷纷布局自己的智慧家庭生态,加入语音交互、AI等功能。无论是何种方式,智能家居要落地可能还需要一段较长时间,因为这其中涉及到一整个云端平台和生态的打造,由某一家公司掌控或打通可能还是比较难的。“这样我们是否就不能享受像智能家居中语音控制家电的便利呢?,其实家庭中很多设备,包括空调、窗帘、烧水壶、晾衣架、台灯等等,并不一定需要语音交互,我们只是需要去简化他们的控制方式,例如用语音控制来替代遥控方式,赋予一款产品具备被语音控制的能力,从而更高效解决用户需求。”邱松晓表示。

 

对于这些仅仅需要语音控制而不需要交互的设备,用离线的方案或许更为合适。首先,离线智能语音交互模块由于没有了网络传输的时间损耗,语音交互的实时性更高,据了解识别过程只需要200ms,命令发出马上可以做出反应,基本感觉不到延迟,用户体验好;其次因为无需配网,离线智能语音交互模块具备用户开机即用的属性,无需教育用户。同时不存在网络异常的意外情况,使用友好度非常高。再者,成本更低,与在线方案十几美金的成本相比,离线的方案只需几美金;而且,离线方案的目标市场更多是单品,不涉及云端网络或数据安全问题,产出会快很多。

 

通过不断模型训练和测试,离线方案识别率可达95%

不过离线语音往往被认为是相对在线语音识别定位更为低端的应用,但是在技术上做到“离线语音识别”其实并不简单。“我们常常说‘台上一分钟,台下十年功’,对离线识别来说,也正正是这样。在将声音送入到设备之前,同样也需要做语音的远场拾音、降噪、回声消除等处理,将处理干净的声音就会和本地的模型进行匹配,如果匹配就执行动作。整个过程看似简单,但是在命令词的模型建立也需要花费不少功夫。” 上海互问信息科技有限公司华南区销售总监孔令亚说到,“离线的方案需要给每一个命令词建立一个匹配模型,每一个词会录入至少800个左右的样本,样本经过不停的训练、模型匹配和测试,只有通过测试这个模型才定下来,放到内存中。外界发出一条指令,就会和本地的模型进行匹配,如果匹配才能执行动作。目前我们可以做到200多条命令词,不过一般应用场景在十几天到几十条就已经足够了。”

 

此外,离线方案在一些指令或词条的识别率甚至可做到比在线的高,例如互问信息离线语音控制模块在家居环境下达到了95%识别率、2次/天的误触发。孔令亚解释道,因为从样本和训练的数据量来看,建立模型的出发点就不一样。离线的每一个词条是专门花和时间去优化。而在线的不会去这么做,中国的语言量这么丰富,方言这么多,这个工作量就非常大。例如‘请开门’这个指令/词条,在线的方案不会专门去建立这样的一个指令样本和模型去进行训练匹配,因为工作量太大难以实现。。所以在线的语音识别是针对字或句,而不是词条,如果说一个‘打’字,在线方案可能很快可以识别,但是如果说‘打开门’,语速快些或带有情感,因为没有这个词条的大量样本训练,很有可能就会误判或识别慢。。

 

“为达到95%识别率、2次/天的误触发,我们要求每个语音命令词都有800人左右的样本,在声音训练过程中,不断调整命令词的语音模型,这些训练样本中也包含了多个地方性的普通话,如广东地区、湖南地区、河南地区、北京地区等普通话。”他说到,“我们生成一个命令词的时间需要6周左右的时间,前4周时间样本采集和训练,后两周时稳定性测试。互问提供的语音命令词,在国内使用几乎是没有存在太多问题,95%的识别率也是目前比较高的参数了。”

 

离线方案潜在市场或将开启,下半年将陆续出货

“目前我们方案还没有完全推开,可以看到大家近端时间关注点都集中在智能音箱上,其实离线也是一个潜在的市场,与智能音箱也不算是竞争关系,大家各有应用场景。智能音箱去做交互都还可以理解,但是去控制一个家电的时候,这个过程还是比较复杂的,涉及到很多问题,生态问题,云平台问题、安全问题。”邱松晓分析说,“像空调、烧水壶、台灯、目前还没有涉及到和家电深度交流,这是机器人需要去做的事情,没有人会想和空调去聊天。未来如果把计算机的能力集成到家电中,你靠近了家电就能感知判断出你想干什么,这是真正的智能的,但是目前还没有人能做到这一块,也没什么人愿意去做,成本和用户体验都是一道坎。所以目前大家的诉求就是加个语音控制,多了一种控制的方式,成本也不会提高很多,但是却解决需要到处找遥控器的痛点,对消费者来说,达到方便舒适的功能就可以,不会去追求超前技术。”

 

离线识别方案其实早就有出现,不过因为识别率等问题一直没有铺开。早在一两年前还是85%左右的识别率,随着技术的发展,目前离线语音在家居环境中可以达到了95%,而且可以做到5m距离的远场拾音、高语音识别率,低误触发率让这一方案进入家庭、开启市场成为可能。

 

孔令亚指出,消费者的操作习惯、市场的需求和声音技术的积累,都是决定离线语音控制产品的市场发展的因素。近些年声音技术公司的涌出,声音信号处理技术提升和声音样本的积累,实现了离线语音识别率的提高,也就提升了用户体验,使用说话的方式去控制设备,必然会得到消费者喜欢。国内能够提供商业性的离线语音控制方案的厂商仅几家,并且前几年这几家公司都重点去投入在线语音识别和声音相关的内容服务。所以离线语音控制方式的市场打开进度也受到一定的限制。但是离线语音控制方案的市场近期必然会被打开,离线语音控制方案成本低、量产速度快,控制准确率高。离线语音控制方案以轻量级方式进入到各个产品中,而不会像在线语音识别那样生态系统复杂。

 

从市场反馈上看,目前家电厂商对这种方案的接受程度还是比较理想的。据了解,现在市场存货量已经超过百万级别,并且目前离线语音控制的声控台灯、晾衣架、烧水壶等已经在量产出货,在接下来的一年内,消费者将在空调、抽烟机、风扇、家居控制面板、按摩仪、故事机、空气净化器,热暖器,热水器等产品中都可以体验到,互问信息的模块都已经切入到国内这些产品生产商进行项目配合。

 

“我们的离线模块也是去年才开始推出,在之前有储备很多研究和设计。客户拿到样本测试到生产,可能需要半年到一年时间不等,所以还没有那么快有典型的产品出来,预计今年下半年就有成品陆续出货。接下来一年出货量肯定不止1KK。”邱松晓对于市场前景信心满满。


关键字:智能家电  人工智能 引用地址:智能家电一定要说话?

上一篇:同质化如此有严重,互联网电视或面临大洗牌
下一篇:苹果、华为和微软出货量占全球平板电脑市场份额的40%

推荐阅读最新更新时间:2024-05-03 03:10

人工智能得天下 什么才是真AI?
  AI概念笼统,范围广大,到底什么才是AI的核心?下面就随网络通信小编一起来了解一下相关内容吧。   美国当地时间5月8日,一年一度谷歌I/O开发者大会在山景城举办,外界的焦点皆为谷歌利用AI在各项研发方向的进展。据悉,谷歌已经开发了最新的AI智能工具,可以为从智能手机到智能冰箱等各种类型的产品提供动力。GBH Insights首席策略师丹-艾弗斯也表示,这次的I/O大会, 人工智能 将成为重中之重。谷歌希望开发者将赌注都压在自己的平台上。谷歌已经适当地发布数字语音助手Google Assistant到TensorFlow机器学习引擎。谷歌的表现已经说明一切,AI的浪潮席卷全球,谷歌正在利用自己的AI技术影响不同行业,而不管如
[网络通信]
人工智能时代 云和大数据到底有多重要?
    数字经济和工业4.0少不了云助力 60年前的某个夏天,麦卡锡、明斯基等年轻的科学家们举办了一次聚会,共同研究用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出。如今,人工智能已经应用于语音识别、图像处理器、计算机视觉、机器人等多个领域,甚至击败了围棋九段李世石,这种进步是难以置信的。而这一系列成绩的背后,是海量数据的积累与学习,在没有云的时代,是无法想象的。 人工智能时代 云和大数据到底有多重要?(图片来自The Huffington Post) 人工智能涉及的领域非常广泛,工业、航天、商业都有应用,并且已经深入人们的生活,打开手机中的Cortana或者Siri,这就是AI的产物。要
[安防电子]
Qualcomm 人工智能引擎AI Engine支持骁龙移动平台的AI功能
2018年2月21日,圣迭戈——Qualcomm Incorporated(NASDAQ: QCOM)子公司Qualcomm Technologies, Inc. 今日宣布,推出Qualcomm人工智能引擎AI Engine(Qualcomm Artificial Intelligence Engine,AI Engine)。该人工智能引擎AI Engine由多个硬件与软件组成,以加速终端侧人工智能用户体验在部分Qualcomm®骁龙™移动平台上的实现。骁龙845、骁龙835、骁龙820、骁龙660移动平台都将支持该人工智能引擎AI Engine,其中骁龙845将支持最顶尖的终端侧人工智能处理。 最大化位于边缘网络中客户终端的
[半导体设计/制造]
专访互联网科技大佬:企业如何通过人工智能提升自己?
每一款应用软件都可以从人工智能中受益——安全、市场营销、IT基础设施、金融技术等。大量的数据和云基础设施让带有机器学习技术的应用软件拥有了识别模式,目前这些技术还不是很强,但随着技术革新它们会慢慢变强大。下面就随手机便携小编一起来了解一下相关内容吧。 记者:“企业如何通人工智能(AI)提升自己?” 下面是一众科技大佬的回答: AI如何帮助企业规避欺诈和风险 ·每一款应用软件都可以从人工智能中受益——安全、市场营销、IT基础设施、金融技术等。大量的数据和云基础设施让带有机器学习技术的应用软件拥有了识别模式,目前这些技术还不是很强,但随着技术革新它们会慢慢变强大。 ·这取决于AI在一个领域的垂直度。就像石油和天然气工程队知道下一步
[手机便携]
巨头们的AI“夺金”战:谷歌,微软还是阿里,腾讯?
  在曾经的淘金热中,赚大钱的不仅是淘金者,还有那些给淘金者卖矿泉水的人。下面就随网络通信小编一起来了解一下相关内容吧。   AI淘金热潮中,企业和国家都在砸大价钱抢占市场: 谷歌 、亚马逊、 微软 和IBM在2016年砸下超过200亿美元来打这场硬仗。各个企业一边争先恐后地观察对手,确保能抢先意识到AI的生产力优势,一边把眼光瞄准初创公司。   中国在AI上投入了大量资金,而欧盟由于担心失去在中美的市场份额,也计划了将差不多220亿美元投资于AI。   但正如以往的淘金浪潮一样,最重要的是谁能真的找到“黄金”。   是那些少数敢于创新的巨头企业独占鳌头吗?活跃的初创企业能从中分得一杯羹吗?或者,提供淘金工具的人获利最大?究竟
[网络通信]
NVIDIA稳坐AI龙头? Xilinx:FPGA处理速度快过GPU
日经亚洲评论13日报导,NVIDIA Corporation虽凭借通用GPU(GPGPU)登上人工智能(AI)芯片一哥位置、但竞争对手早已在一旁虎视眈眈。美国低功耗现场可程序逻辑门阵列(FPGA)制造商Xilinx表示,伙伴厂商利用FPGA芯片进行基因体定序与优化语音识别所需的深度学习、察觉FPGA的耗能低于GPU且处理速度较快。 相较于GPU只能处理运算,FPGA能以更快速的速度一次处理所有与AI相关的信息。 英特尔(Intel Corp.) 在2015年底并购美国FPGA厂商Altera。 在GPU领域落后NVIDIA、超威(AMD)的英特尔打算藉由Xeon Phi进军AI芯片市场。 NVIDIA Corporati
[半导体设计/制造]
基于NVIDIA® Jetson™ Orin的凌华科技ROScube-X RQX-59系列,重新定义 AI 性能
摘要 相比上一代产品,提供 6 倍的 AI 性能,突破性的 RQX-59 系列,为您的机器人和自动驾驶解决方案带来巨大变革 • ROScube-X RQX-59系列基于NVIDIA® Jetson™ AGX Orin模块设计,AI性能较上一代产品提升6倍。 • ROScube 是一个高度通用的模块化机器人控制器系列产品,作为嵌入式边缘 AI 平台的一部分,专为以 AI 为中心的机器人和自动驾驶应用而设计,并由 NVIDIA Jetson 模块提供强大的算力支持。 • ROScube 系列提供无缝的扩展能力,可跨行业满足各种解决方案的需求。 • ROScube系列基于NVIDIA JetPack SD
[工业控制]
基于NVIDIA® Jetson™ Orin的凌华科技ROScube-X RQX-59系列,重新定义 <font color='red'>AI</font> 性能
Revolv:通过WiFi统一控制智能家电
    Revolv:通过WiFi统一控制智能家电   家庭自动化在20年前就开始萌芽,期间断断续续地发展,但直到今天,家庭自动化市场上依旧缺乏重量级产品,让这个领域能够真正发展起来。Nest、Sonos、Insteon、飞利浦等一线厂商都曾推出过智能家电管理中心,不过他们的方案都没有Revolv出色。   和Sonos、Insteon的同类设备一样,Revolv也是个智能家电统一管理中心。它的核心部件是一只淡红色的圆形盒子,这只盒子事实上是个 “Wi-Fi收纳器”。它可以通过Wi-Fi与智能家电连接,然后统一它们。   不过在此之前,你需要在iPhone上安装配套的应用才能使用它。好在应用的下载、安装非常独特,通过脉冲光进行传
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved