带屏智能音箱的互动更直观,出货需求增长

发布者:SereneSoul55最新更新时间:2019-05-09 来源: eefocus关键字:智能音箱  AI  语音交互 手机看文章 扫描二维码
随时随地手机看文章

谷歌在第11届GoogleI/O大会上发布了10英寸带屏音箱NestHubMax,售价229美元,这也是自Nest并入谷歌后双方共同打造的第一款产品。

 

虽然还有不少人质疑带屏智能音箱是鸡肋产品,不过与纯语音交互相比,带屏幕的互动更直观。目前,互联网巨头包括亚马逊、谷歌、Facebook和百度等都推出了带屏智能音箱,将智能音箱作为入口,提供自己原有的服务。

 

市场调研机构StrategyAnalytics的最新研究显示,智能音箱是2018年最热门的消费电子产品。2018年第四季度的出货量增长了95%,达到3850万台,超过了2017年的总量。其中,带屏智能音箱占智能音箱的总出货量需求的10%以上。

 

Strategy Analytics总监华特金斯(DavidWatkins)评论道:“谷歌的HomeHub、亚马逊的EchoShow和百度的小度在家等带屏智能音箱受到消费者的欢迎,他们被音视频结合吸引。与仅有语音交互而言,带屏智能音箱使用场景更多。预计到2019年,带屏智能音箱将成为市场增长的重要推动力。”

 

 

创新落地的载体

“天猫精灵,今天北京天气如何?”“今天北京天气晴,12℃~28℃,空气指数30。”

 

拥有天猫精灵音箱的小伙伴对于上述对话一定不会陌生。天猫精灵体现的是对话式人工智能,整个人机交互过程可分为唤醒、识别、理解、反馈四个环节。

 

“今天北京天气如何?”这段语音能够通过语音识别转换成文字,提取“今天”、“北京”、“天气”等关键词,通过背后的天气预报网站将数据调取出来;从天气预报网站调取出来的数据组装成自然语音,就是语音合成,即“今天北京天气晴,12℃~28℃,空气指数30。”

 

“之所以加入阿里巴巴,主要是自己更偏向于技术落地的工作。”天猫精灵语音技术负责人聂再清在接受第一财经记者采访时表示,此前在微软亚洲研究院工作时带领的研究项目(人立方、微软学术搜索、LUIS)就比较偏创新和实际技术落地的结合。

 

加入阿里巴巴人工智能实验后,让他感受最强烈的是这里创新落地的速度,以及前沿技术与产品配合的紧密程度。自2017年10月9日加入阿里巴巴以来,聂再清就一直负责天猫精灵语音助手算法的研发工作。

 

阿里巴巴人工智能实验室并不是一个纯研究部门,它与业务和商业是紧密相关的,即使是前沿技术研发也是为未来的业务与商业研发。这意味着,实验室除了学术以外,还有自己的产品以及商业逻辑。

 

以连续对话能力为例,很多用户都表示过每次和天猫精灵说话前都要叫一次“天猫精灵”有点累,能不能实现一个功能使得用户在短时间内和天猫精灵的多次交互只需唤醒天猫精灵一次?要实现这个连续对话能力的最大的技术挑战是能够区分用户的哪些话是对天猫精灵说的,哪些话不是。为了识别用户对天猫精灵说的话这里有两类信息可用:用户说的语义内容和用户声音的强弱、停顿、方向等声学特征。

 

天猫精灵的语音语义科学家们经过多次脑暴,一起独创了融合语音和语义特征的混合神经网络,融入了长短期记忆网络(LSTM),卷积网络(CNN)和注意力机制(Attention),并结合预训练的语言模型,通过海量数据的训练,深度网络自主学习到人机对话提取的能力。最终,在让用户能够享受到便捷的连续交互的同时,实现了业界最低的误打扰率。聂再清透露,目前已经有超过一百万用户主动打开这个功能,成为语音交互一种新的对话模式。

 

不过,每个人的兴趣爱好不同,一个家庭中多个成员共用一个天猫精灵,此前就存在天猫精灵将父母喜欢的歌曲推荐给女儿的情形。

 

聂再清表示,声纹算法科学家和个性化推荐科学家一起提出了一种不依赖于声纹注册的开创性的解决方案:把语音指令的声学特征在我们的个性化推荐深度学习模型(Transformer)中直接使用,创造性地解决了声纹注册率低和声纹聚类不准导致的语音助手多人混用的个性化推荐技术难题。大众盲评的用户调研数据显示,加入声纹后大大降低了歌曲推荐的兴趣混乱程度,有效地解决了多人混用的推荐难题,用户的人均时长提升10%。

 

不再是单纯的硬件战争

智能音箱的战争不再是单纯的硬件战争,更多场景的升级和创新功能的加入或许是更加重要的一环。数字中国峰会现场,百度CEO李彦宏称,以智能音箱为代表的智能家居,可以说是AI时代搜索的新入口,它让人们用更自然的方式和机器进行交互,也是家庭里面的信息服务的入口。

 

从某个角度上来说,智能音箱甚至强调的功能也不仅仅是音箱的基础功能了。比如,相较于普通智能音箱,带屏音箱一般增加了屏幕和摄像头。因此,不仅可以实现智能音箱原有的播放音乐、查看天气和新闻、控制智能家居产品等功能,还可以进行视频观看、视频通话功能,甚至集成安防功能。

 

与谷歌上款带屏音箱HomeHub相比,NestHubMax还增加了广角的智能摄像头,并且增大了屏幕尺寸。NestHubMax能实现在线观看视频、家居控制、拍照、安全监控和视频通话等功能。谷歌称,NestHubMax特别为家庭和朋友聚会中的共享场所而设计。

 

此次发布的NestHubMax还增加了脸部匹配(FaceMatch)功能。此项在手机上已经较为常见的人脸解锁功能落地智能音箱以后,可以将每个家庭成员需要的特定服务实时呈现或者推送。

 

谷歌举例称,“早上当你走进厨房时,智能助手知道你的日程安排、通勤细节、天气以及其他当天所需的信息来问候你。当你下班回家时,HubMax欢迎你回家,并提供要处理的提醒和消息。智能助理为音乐和电视节目提供个性化推荐,你甚至可以看到谁给你留下了视频消息。”

 

李彦宏提到,两年前,百度推出全球第一款带屏智能音箱小鱼在家,又进一步激活了百度此前在视频方面的布局。小鱼在家与百度的合作始于2015年,2017年合作推出带屏智能音箱,2017年4月推出搭载百度DuerOS的新款视频通话机器人“分身鱼”,2018年3月,百度宣布战略投资小鱼在家,从资源、资金、平台等各方面予以支持。2019年2月,小度在家带屏智能音箱出货量首次超过无屏的小度智能音箱。

 

“如同下棋讲究占据先机,坚持技术创新,就会让我们下出‘先手棋’,而不是再做跟随者。”就本质而言,李彦宏多次多场合对百度智能音箱的推广,意在争夺智能家居入口话语权。

 

不过,不管是智能音箱硬件技术,还是远场识别、语音识别和语义识别等语音交互技术,都存在不少问题,例如出现误唤醒率高、连续对话不稳定、语义理解能力差等情况。有用户表示,希望能提高识别率,“现在买智能音箱只用来听歌、当闹钟等,而这些手机语音助手就能完成,真正接入并控制家电的太少了”。

 

即使在美国,智能音箱最大的用处也是听音乐。尼尔森此前一份报告指出,几乎所有消费者(90%)都用智能音箱听音乐,而68%的人会听新闻;大约81%的用户会使用语音交互来获取实时信息,例如天气和交通状况。

 

Strategy Analytics副总裁墨瑟(DavidMercer)表示:“现在问题是,如何通过用户群获利,看看每个玩家如何应对这一挑战将会很有趣。第一步是通过智能音箱鼓励消费者更广泛和更频繁地使用应用和服务,这将为设备OEM或平台提供商带来创收机会。语音购物和广告插入是非常明显的方式。”


关键字:智能音箱  AI  语音交互 引用地址:带屏智能音箱的互动更直观,出货需求增长

上一篇:简单粗暴,热水器加装远程WIFI控制功能
下一篇:快闪存储器价格跌跌不休,群联营收表现不佳

推荐阅读最新更新时间:2024-11-02 18:30

再发AI新品 傅盛这次盯上的是翻译
猎豹移动董事长兼CEO傅盛表示,AI不是高高在上的黑科技,而是通过场景落地,解决用户的在特定场景中的需求的真正有用的技术。小豹AI翻译棒是可以让消费者轻松追寻“诗和远方”的 AI新品。与市场上现有的AI翻译产品相比,有四个方面的特点。 一键翻译破除使用门槛 小豹AI翻译棒只设计了一个按键,语言选择以及翻译操作都是通过这个按键实现。音量调节则是在按键左侧进行上下滑动即可完成,可谓简单至极。 此外,配备了双麦克风阵列以及采用了降噪软件解决方案的小豹AI翻译棒,可以最大程度提高收音准确性,而超线性多磁扬声器则能清晰地将翻译语句传达给沟通双方,确保了语义的清晰表达。 一款可以“忘带”充电器的AI产品 据介绍,小豹AI翻译棒可以实现
[机器人]
Gartner:2022年过半AI技术仍未达成熟期
  国际研究暨顾问机构 Gartner 指出,根据人工智能技术成熟曲线,有86%人工智能技术尚未进入成熟期的起点,甚至来到2022年时,54%人工智能技术应用也无法达到技术成熟期、无法进入主流市场,但长期来看有85%的人工智能技术将为产业带来巨大变革转型,并提供高收益及商业价值。下面就随网络通信小编一起来了解一下相关内容吧。   Gartner研究副总裁蔡惠芬表示,运算能力与资料数量的快速成长,加上深度神经网络(DNN)技术获得空前研究成果,让人工智能被誉为未来十年最具突破性的创新技术类别;接下来五年间,可看到许多技术从过热的市场巅峰退下,回归理性和本质,为迈入主流市场应用奠基,企业也可借此沉淀重整的机会,厘清人工智能在企业内的
[网络通信]
图灵奖得主华人门徒AI芯片创业项目OURS进国内市场
    3月28日消息,AI芯片公司OURS近日宣布进军国内市场,且已经与国内一家电子制造企业进行业务合作。同时,OURS也将在中国选择办公地点,目前正在选址。   OURS简写自Optical Universal RISC Systems,是一家2017年2月创建于美国硅谷圣克拉拉的“硅光”公司,主打的核心技术产品为低功耗端计算 (Edge Computing) AI芯片,目的是让机器能够智能地以3D的方式感知世界。   OURS公司2017年5月获得A轮融资,2017年6月获得A-1轮融资,投资方包括北极光创投、Oriza Ventures(元禾谷风创投)以及创新工场。   目前,OURS公司团队有十余人,超过80
[半导体设计/制造]
又一巨头入局,传Facebook研发智能音箱
消息称,Facebook的智能音箱将更加注重视觉画面的交互,而为了保证视觉效果,Facebook将为这款音箱配置一块15英寸的触摸屏幕,据悉,屏幕将由LG显示器公司提供。下面就随手机便携小编一起来了解一下相关内容吧。 亚马逊Echo的风靡,带动了全球智能音箱的风潮,智能音箱创业者雨后春笋般出现,各个巨头也各个摩拳擦掌,想在这个风口做一下尝试,包括苹果、谷歌都已经有成品推出。 今天(7月25日),据台湾电子时报网站引述行业消息人士称,美国科技巨头Facebook也正在开发一款智能音箱。 消息称,Facebook的智能音箱将更加注重视觉画面的交互,而为了保证视觉效果,Facebook将为这款音箱配置一块15英寸的触摸屏幕,据悉,屏
[手机便携]
地平线发布了旭日3全新一代AIoT边缘AI芯片
2020年9月9日,地平线“释放·芯效能”产品发布会于深圳举办,宣布推出全新一代AIoT边缘AI芯片平台——地平线旭日® 3。 “地平线发展5年来,我们做对了很多事,也做错过很多事,但是我们的使命和愿景让地平线屹立于此。”地平线创始人兼CEO余凯在会上表示,我们的使命是赋能万物,让每个人的生活更安全,更美好。我们希望能够成为边缘人工智能芯片全球领导者,通过我们的技术跟服务去成就我们中国的企业家、创业者,把我们中国科技带上新的台阶。 如何赋能万物,是地平线创业至今一直在思考的问题。如今,地平线有了更加清晰的答案。 “智能驾驶和智能物联网就是地平线的双飞轮战略。”余凯表示,我们致力于去打造车规级人工智能芯片,去赋能智能汽车。智能汽
[手机便携]
为什么说人工智能是人类下一个进化阶段?
人类再一次欺骗自己对于人工智能的认知,认为这将是结束。即将到来的技术革命的产物将会逐渐取代我们的工作,并将我们从地球上抹去。其实这并不令人惊讶。   技术恐惧症并不是一种新现象,这是我们在现代社会经历的每一次技术转变的一个显著特征。人们总是害怕被机器取代,然而,从这种过度的集体恐惧中诞生的反乌托邦思想,却从未被证明是真的。   事实上,每一场技术革命都带来了繁荣、生活水平、社会平等和其他积极影响的进步。这场革命会有什么不同的结局吗?当然有!但我们需要采用另一种方式。   人工智能不会让人类成为“无用的阶级”,也不会像一些未来主义者所暗示的那样,造成社会混乱。它将彻底改变之前从未发生过的——针对人类本身的革命。   技术推动着一切
[安防电子]
纳微公布人工智能数据中心电源技术路线图,预计12个月功率密度提升三倍
专注于氮化镓(GaN)功率IC和碳化硅(SiC)技术的纳微半导体(Navitas Semiconductor)日前公布了最新的人工智能数据中心技术路线图。 该公司表示,正在考虑将功率密度提高 3 倍,以支持预计未来 12-18 个月人工智能功率需求的类似指数增长。 传统 CPU 通常仅需要 300W,而数据中心交流/直流电源通常可提供相当于 10 个 CPU,也就是3kW的功率。 然而,像 NVIDIA 的“Grace Hopper”H100 这样的高性能 AI 处理器功耗已经到了700W,下一代“Blackwell”B100 和 B200 芯片预计到明年将增加到 1000W 或更高。 为了满足这种指数级的功率增长
[电源管理]
完美的电池,将来自AI
谁也没有想到,AI会成为2024年诺贝尔奖的最大赢家,物理奖和化学奖两大奖项都与人工智能研究有关。 很多人第一次知道,机器学习的模型是基于物理方程的,而人工智能被用来研究蛋白质的结构。 不知不觉,我们已经步入AI时代。 随着电动汽车在世界各地越来越受欢迎,人们对电池安全性的担忧比以往任何时候都更加紧迫。当AI与电池结合起来,又会有怎样的图景? 预防热失控 动力电池安全性的一个关键问题是热失控,它是由不可预测的温度飙升引发的,可能导致锂离子电池发生灾难性火灾甚至爆炸。 亚利桑那大学(the University of Arizona)的新研究提供了一种新颖的解决方案来解决这个问题,将机器学习与热传
[汽车电子]
完美的电池,将来自<font color='red'>AI</font>?
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved