谷歌全新推出低功耗的离线语音识别模型

2019-09-12来源: eefocus关键字:谷歌  低功耗  离线语音识别模型

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的缺点,那就是会有相应的延迟,用户必须等待Siri或其他虚拟助手来响应查询,而且如果语速过快就有极大可能造成误解。有延迟出现是因为用户的语音以及从中获取的数据必须从要手机传输到服务器,在那里进行分析后再发回。这可能需要从几毫秒到几秒的时间,如果数据包在过程中不小心失,则需要更长时间。


为什么不能直接在设备上进行语音识别呢?因为将语音转换成毫秒级的文本需要相当大的计算能力,这不仅仅是听一段声音和写一个单词,而是逐字逐句地理解一个人在说什么以及涉及到意图和整个语境。当然,手机其实是可以做到这一点的,但这并不会比把手机上的内容发送到云端快多少,而且会大量耗电。但随着该领域的稳步发展,这一目标似乎已成为可能,谷歌就使得这一功能在Pixel上得到实现。

谷歌推出全新低功耗的离线语音识别模型

为实现这一转变,Google团队花了五年时间研究问题并简化用于语音识别的AI系统。例如,旧版Gboard的听写软件由三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成文字输出,更新后的版本将所有这些工作集合到一个步骤中。


新模型还缩小了系统中被称为“解码器图形”的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配。在Gboard的听写模型的旧版本中,这个解码器图形大小为2GB,对于设备上处理来说太大了。相比之下,新版本仅为80兆字节,缩小了25倍。

你只需要说出你的查询,它会立刻被转录下来,并直接显示。它听到了你的声音后会立刻响应,而不用等到你完成整个句子再去揣测你的意思。但目前它只在谷歌键盘应用程序Gboard中工作,只在Pixel上工作,而且它只适用于美式英语。


“考虑到行业趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术可以很快用于更多语言和更广泛的应用领域,”谷歌写道。


关键字:谷歌  低功耗  离线语音识别模型 编辑:什么鱼 引用地址:http://news.eeworld.com.cn/qrs/ic474383.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:AI技术在家电行业中的发展将如何?
下一篇:AI语音识别和分析的感知技术是如何获得的?

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

可穿戴设备厂商Fitbit最好的归宿是亚马逊?
;还有其他相似之处。两家公司都以价格更实惠的主流消费者为目标而闻名,通常会在价格上低于竞争对手。Fitbit在最近几个季度一直在亏损,但是这似乎并不像亚马逊曾经害怕过一点红字。 Alphabet子公司谷歌也是一个潜在的收购者,Fitbit聘请的投资银行Qatalyst Partners表示,这家搜索巨头可能有兴趣收购Fitbit。 但是,谷歌已经有了一个智能手表平台,尽管这是一个挣扎的平台。Wear OS一直在争取市场吸引力,这在一定程度上是由于第三方制造合作伙伴放弃了操作系统,转而使用三星 Tizen 等内部替代产品。有传言称谷歌正在开发一款Pixel智能手表,但该产品实际上可能在多年前就被淘汰了。换句话说,谷歌
发表于 2019-10-08
可穿戴设备厂商Fitbit最好的归宿是亚马逊?
谷歌Pixel 4 XL上手图 将于10月15日发布
      据此前消息,谷歌将会在10月15日正式发布新一代手机产品——Pixel 4系列。其中将包括Pixel 4和Pixel 4 XL两款机型,近日,有外媒再次晒出了Pixel 4 XL的真机上手图。  从图片来看,谷歌Pixel 4 XL的外观与之前爆料基本一致,正面的左右两侧和下巴边框控制的都比较出色。而屏幕上方则拥有一个比较宽的额头。背部则在机身左上角放置了一块体积硕大的“浴霸”三摄模组,规格分别为主摄+长焦+3D ToF景深镜头的组合。  具体配置方面,Pixel 4 XL将会搭载一块6.3英寸19:9比例的屏幕,分辨为1440x3040,屏幕刷新率为90Hz。核心搭载高通骁龙
发表于 2019-09-29
小米或将开发运行谷歌Wear OS操作系统的智能手表
据科技博客网站9to5Google的消息称,小米正在开发一款智能手表,运行谷歌Wear OS操作系统。在谷歌日前推出的Wear OS应用2.28版中,出现了名为“Mi Wear”的配套应用。据了解,谷歌WearOS允许设备制造商在Android系统上提供他们自己的配套应用。WearOS在最近的2.28版本更新中,新支持“Mi Wear”设备,除了Mi Wear,在相关代码中还出现Mi Watch名称产品,这很有可能就是小米的智能手表产品。此前有消息称,小米智能手表将在10月推出,搭载高通骁龙穿戴平台,全部标配NFC,一款方一款圆。
发表于 2019-09-28
小米或将开发运行谷歌Wear OS操作系统的智能手表
谷歌推出了订阅服务PLAY PASS
       近日苹果在全球推出了旗下iPhone11系列新品,同时还推出了游戏订阅服务Apple Arcade。为了对抗苹果在游戏方面的行动,谷歌也在昨天正式公开了游戏订阅服务Google Play Pass,价格与Apple Arcade完全相同,但是游戏数量却多了几倍。  Google Play Pass宣传片:  和苹果的Apple Arcade一样,Google Play Pass也是一种固定收费的游戏订阅服务,购买了该服务的用户可以爽玩数百款游戏APP或工具,而不再需要观看烦人的广告、想要使用或解锁更多内容时也不必额外付费。通过预告片可以看到《纪念碑谷2》、《星露谷物语》、《地狱
发表于 2019-09-27
可“商用”量子计算机问世,IBM开发出的最强大量子处理器
众所周知,量子计算机依据一套完全不同于经典计算机的量子力学法则运行。经典计算机中的比特为0或1,基于此进行二进制运算。在神奇的“叠加态”加持下,量子比特却可以同时是0和1,正如薛定谔那只著名的又生又死的猫。在理想状态下,50个量子比特一次可以进行2的50次方次运算,这已经是个天文数字。换言之,超导量子计算系统通常需要更多的量子比特来保护用于计算的量子比特,量子比特的质量与数量同样重要。正因如此,谷歌虽然早在2018年3月就发布过一款由72比特组成的量子处理器,但当时并未突破量子霸权。此外,美国IBM公司和一些初创企业也在提供所谓的量子计算服务,但它们只能在特定问题上表现出相对于一般计算机的优势,无法击败最强超算。美国能源部下属橡树
发表于 2019-09-25
谷歌Pixel 4系列将有骚橙颜色,或是年度最抢手配色
据外媒PhoneArena称,即将推出的谷歌Pixel 4系列将有橙色配色,并且博主科技杰克也放出了橙色版的Pixel 4外观,这个橙色比较靓丽抢眼,相信能成为这款机型最抢手的配色。其实在纽约时代广场LED灯广告牌上,也出现过橙色版的谷歌Pixel 4一角。据早前9to5Google透露,Pixel 4系列官方配色将有黑色、白色和橙色。随后有另外的声音指出,官方的Pixel4手机壳有蓝色、粉色、黑色和橙色。配置方面,预计Pixel 4系列将采用骁龙855处理器。并且会搭载6GB RAM和64GB/128GB ROM。Pixel 4将配备2800mAh的电池,而Pixel 4 XL则配备3700mAh的电池。Pixel 4应该会采用
发表于 2019-09-24
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved