科大讯飞“AI同传造假”风波之后,谷歌实时翻译也出问题了

发布者:静心静气最新更新时间:2018-10-30 来源: eefocus关键字:谷歌  耳机  人工智能 手机看文章 扫描二维码
随时随地手机看文章

据连线杂志报道,知名语音识别公司科大讯飞卷入的“AI同传造假”风波依然还在发酵,引发了人们关于AI实时翻译技术的更多关注。

 

不久前,谷歌悄悄改变了Pixel Buds耳机的支持页面,并写道:“所有经过Google Assistant优化的耳机和安卓手机,现在都可以使用谷歌翻译。”此前,这一功能仅限于Pixel Buds耳机和Pixel手机用户。尽管谷歌并未大张旗鼓地宣布这个消息,但这个小小的调整却值得注意。

 

实时翻译最初仅限于支持Pixel Buds,但现在可用于任何支持Google Assistant的耳机

 

要知道其中原因,首先我们来了解下谷歌耳机的历史。谷歌去年推出了无线耳机Pixel Buds,此前该公司曾大肆宣传过这款产品,称其是一款革命性的工具,支持实时翻译功能。只要轻敲Pixel Buds,说“帮我说”,它就会打开你手机上的谷歌翻译应用。现在,Pixel手机也同样支持这个功能。

 

接着,你可以说出句子,谷歌翻译会在手机上将其翻译成目标语言,并进行转录,然后读出来。理论上,谷歌的新技术甚至会让口译翻译们担心丢掉工作。这款产品在舞台上的实时翻译演示获得了巨大成功,但当其开始发货时,人们对其似乎产生了怀疑:翻译的质量没有达到公众的预期。

 

 

科技网站用十种不同的语言对实时翻译功能进行了测试。它成功地翻译了些基本问题,比如“最近的医院在哪里”,但当句子变得更复杂,或者说话人有口音时,翻译就会出现错误。评论员们得出的结论是,实时翻译似乎有点儿“欺骗嫌疑”,Google Assistant需要努力理解对它说出的话。

 

消费技术资深分析师丹尼尔·格里森(Daniel Gleeson)说:“掌握自然语言是非常困难的。对于谷歌来说,这将是个巨大的成就,而他们实现这个目标的那一天,可以自豪地大声说出来。”或许有些人可能会说,这可能也是Pixel Buds支持页面更新的信息被隐藏起来的原因。

 

谷歌的问题不在于翻译过程本身,事实上,该公司在过去几年始终在提升其翻译应用水平。2016年,谷歌将其谷歌翻译转换为基于深度学习的人工智能(AI)驱动系统。在此之前,该工具将每个单独的单词分别翻译,并应用语言学规则使句子在语法上保持正确,从而导致了我们非常熟悉的、支离破碎的翻译效果。另一方面,神经网络则将句子作为一个整体来考虑,并根据之前训练过的大量文本数据来猜测正确的输出结果。通过机器学习,这些系统能够考虑句子的上下文,从而提供更准确的翻译。

 

整合机器学习是Google Brain团队的任务,该团队是谷歌专门致力于深度学习研发的部门。Google Brain还将神经网络应用到另一个工具上,这是实时翻译的关键,但这似乎也导致其容易在语音识别上犯错。实际上,Google Assistant经过了数小时的语音培训,它会使用机器学习工具来识别模式,并最终正确地识别出被要求翻译的内容。

 

那么,如果谷歌在某种程度上成功地将神经网络应用到文本-文本的翻译中,为什么Google Assistant仍然不能使用相同的技术精准地进行语音识别呢?剑桥大学自然语言处理研究人员马西基·霍瓦特(Matic Horvat)说,这一切都归结于用来训练神经网络的数据集。

 

霍瓦特说:“系统能够适应它们所得到的训练数据集。当你把它介绍给它从未听过的东西时,语音识别的质量就会下降。例如,如果你的训练数据集是会话语音,那么在繁忙的环境中识别语音效果就不会太好。”

 

干扰是任何致力于提高语音识别技术的计算机科学家的克星。去年,谷歌通过其数字新闻创新基金会向伦敦初创企业Trint投资1.5亿欧元,该公司在自动语音转录方面处于领先地位,尽管其算法与谷歌不同。然而,Trint的算法在处理基本的干扰问题上并没有表现得更好。

 

事实上,Trint的公司网站专门用了长长的篇幅来介绍如何在安静环境中记录演讲内容。该公司声称,其操作存在5%至10%的误差,但它明确表示,这适用于安静环境的录音。Trint首席执行官杰夫·科夫曼(Jeff Kofman)说:“最大的挑战是向我们的用户解释,我们的表现只能和他们给我们的音频一样好。在有回声、噪音甚至重音的情况下,算法就会出错。”

 

现场演讲所带来的挑战意味着,在创建神经网络的过程中,训练过程是成本最高、耗时最长的部分。而像谷歌对Pixel Buds所做的那样,只在有限数量的设备上支持实时翻译,当然无助于系统学习。实际上,它处理的语音越多,它可以向算法中添加的数据就越多,机器就越能学会识别不熟悉的语音模式。

 

对于消费技术资深分析师格里森来说,这是谷歌将该功能扩展到更多硬件的原因之一。他表示:“语音识别中最棘手的问题之一,就是收集足够的特定口音、俗语、习语数据,所有这些都是高度区域化的。将这个功能仅用于Pixel上,永远不会让谷歌接触到那些区域化数据,进而也无法处理足够多的数据。”

 

 

然而,积累数据也有不利的一面。表现最好的神经网络是那些拥有最多数据的网络,但由于数据需要在CPU上处理,CPU的压力也会随着信息量的增多而增加。这类CPU还远未达到与移动设备完美集成的程度,使得实时语音处理在今天依然无法成为现实。实际上,每次使用Google Assistant时,语音信息都会被发送到数据中心进行外部处理,然后再发送回用户的手机上。这些计算工作都不是在本地完成的,因为现有的手机无法存储神经网络处理语音所需的庞大数据。

 

霍瓦特说,虽然Google Assistant能够相当快地完成这一过程,但距离实时语音识别还有很长的路要走。该公司目前面临的挑战之一是,如何在手机中整合神经网络处理,以提高实时翻译等功能的无缝性。事实上,开发人员已经在致力于开发适合于高效处理神经网络的小型外部芯片,这种芯片可以集成到手机中。例如,本月早些时候,华为宣布了一种AI芯片,该公司声称其可以在几分钟内训练好神经网络算法。

 

虽然谷歌有自己的芯片Edge TPU,但它是为企业用户而不是智能手机设计的。对霍瓦特来说,这是它的致命弱点:作为一家软件公司,谷歌对制造商没有多少控制权,无法确保开发出一种产品,使所有安卓设备都能使用本地神经网络处理,与苹果截然不同。

 

在不久的将来,谷歌可能被迫采取更小的步骤来改进其语音识别技术。虽然实时翻译引来了许多批评,但对于行业分析师、Counterpoint物联网、移动和生态系统研究主管尼尔·沙赫(Neil Shah)来说,扩展它有益于谷歌参与竞争:“谷歌已经获得20亿安卓用户。随着越来越多的用户开始在安卓手机上使用最新的语音交互,它能够比竞争对手更快地扩大规模,并接受大量输入数据流的训练。”

 

格里森所也赞同这种看法。无论对实时翻译的评论是否坚持温和嘲讽的基调,谷歌的举动最终都会带来显著的改进。就像所有的AI产品一样,这个工具同样需要学习,它进入市场的过程还没有完成。格里森表示:“人们可能会说,谷歌的实时翻译运作方式与承诺的不一样,但这是其实现目标的唯一途径。”口译翻译现在不必担心他们会立马丢掉工作。


关键字:谷歌  耳机  人工智能 引用地址:科大讯飞“AI同传造假”风波之后,谷歌实时翻译也出问题了

上一篇:这家中国智造赋能大型呼叫中心,敢于对效果及转化率负责
下一篇:动荡的业绩与股价,蓝思科技增长现疲态

推荐阅读最新更新时间:2024-05-03 03:20

新型手掌识别技术面世 结构丰富且更安全
如今,随着人工智能领域的发展,生物识别技术正迎来全面爆发。除了传统的指纹识别,近年来人脸识别、虹膜识别、语音识别等都应用迅速,而现在,新型掌纹识别也正式面世。   根据外媒TechCrunch的报道,两位前LeapMotion员工认为他们已经解决了密码和身份管理的长期问题。这两位前LeapMotion员工成立了一家RedrockBiometrics公司,该公司的技术正在向世界上大量的身份识别技术、PIN码、密码和语音识别技术宣战。新的识别技术结合了现成的硬件和专有软件,以识别掌纹来验证用户身份。   RedrockBiometrics公司董事长LennyKontsevich表示,该公司看到
[安防电子]
特朗普政府要对中国加征关税,苹果、谷歌都提出反对
代表 美国 多个经济领域的45个行业协会向特朗普政府请愿,要求暂停向中国加征 关税 的计划,并要求美国与其他国家合作施压中国,以结束中国对外国企业的限制。 这些行业组织在请愿信中表示,加征高额关税将引发报复行动,触发一系列连锁反应,将对美国经济产生负面影响。信函称,此举会冲击美国的农业、商品和服务出口,并且增加企业和消费者的成本。   据《华尔街日报》(The Wall Street Journal)报道,白宫正在酝酿一系列举措,包括每年对至少300亿美元的进口中国产品加征关税,从而施压中国政府停止要求美国企业向中国公司转移技术。 相关决定可能在本周或下周揭晓。现在阻止美国政府加征关税可能为时已晚,但这些行业协会希望至少延缓这
[嵌入式]
ARM抢攻服务器芯片市场 与英特尔AI战争即将开打
在手机领域大放异彩的芯片业者ARM触角再向外延伸,其和微软(Microsoft)、惠与科技(Hewlett Packard Enterprise;HPE)等大厂合作,抢攻英特尔(Intel)独占的服务器市场,目标至2021年市占从零提高到25%,ARM与英特尔的人工智能(AI)战争即将开打。   HPE、微软和英特尔在服务器市场是盟友关系,微软与英特尔的关系起于1990年代,其结合传奇性的Wintel联盟,使得PC进入主流市场;HPE前身HP,则和英特尔携手研发64bit处理器Itanium,陆续从大型服务器到PC都采用英特尔制的处理器,如今双双发布采用ARM架构的消息。   HPE于2017年5月发表新款电脑原型机The Mac
[半导体设计/制造]
iPhoneX/8Plus/一加5T/三星S8+/谷歌Pixel2XL充电速度大PK ,一加5T完胜
需要指出的是,iPhone X和iPhone 8 Plus的销售包装中,并未标配快充充电器,恤额外购买。不过,如果拥有MacBook USB-C充电器,是可以直接使用的。至于Android阵营,充电功率至少在15W以上。为了体现iPhone X使用快充的差异,iPhone 8 Plus使用标配5V1A慢充进行测试,其2691mAh电池容量与X相当(2716mAh)。 测试过程很简单:所有手机完全放电、并接上充电器插入插线板,然后按下插线板开关同时开始充电。测试118分钟后,一加5T第一、iPhone X紧随其后。 充电30分钟后,一加5T的电量已经达到57%,iPhone X也充满了一半,还是非常理想的。而使用标配慢充的i
[电源管理]
谷歌退出中国内地市场5年 每年损失50亿美元
       2010年谷歌将服务器由中国内地搬到香港,尽管放弃了内地搜索市场,但是明显没有真正放弃中国内地庞大的用户群体。   谷歌退出中国每年损失50亿美元   【产业·公司】退出内地市场5年后,谷歌铁定要回来   《中国经济周刊》 记者 张燕丨北京报道   日前在北京举办的TrenCrunch国际创新峰会上,谷歌 母公司、Alphabet执行主席施密特(Eric Schmidt)公开表示,他此次来到中国的目的之一是希望能够和中国政府保持沟通,希望Google能够为中国提供服务。   如果说之前有关Google即将回归中国内地的消息还只是传言,那么此次施密特的表态无疑相当于谷歌自己证实了传言。而就在此几天前,谷
[手机便携]
减小手机耳机放大器的RF敏感度
问题 很多现代音频放大器的设计没有考虑高频RF问题,而这些放大器却越来越多地暴露在强RF干扰环境中。对于没有解决RF干扰的音频放大器设计,会将RF载波信息解调到音频频带。 一个非常突出的例子是GSM (全球移动通信系统)蜂窝电话系统。GSM标准采用时分多址(TDMA)方式实现多部手机与一个基站的同时通信。GSM手机以217Hz突发频率发送数据,从而产生一个受217Hz频率调制的强电场,恰好处于音频频带。虽然GSM手机工作在800MHz至1900MHz频率范围,但217Hz的包络是固定的。 GSM手机内的放大器必须能够抑制RF载波的217Hz包络频率,或完全屏蔽其电场。放大器与音频信号源之间的引线相当于天线。对于1/4波长与引线
[网络通信]
AI赋能智能制造(三)| 突破单体智能,机器人如何展现群体高智商
通过上一期系列文章,我们从“看得懂、停得准、走得稳”三个层面对边缘节点之海康威视移动机器人进行了全面解读,今天我们将从海康威视AI Cloud体系中的边缘节点过渡到下一个圈层——边缘域,从RCS机器人控制调度系统、iWMS智能仓储管理系统到VM算法平台,依次剖析,揭开智造未来的面纱。 本期主讲 AI赋能智能制造系列之RCS机器人控制调度系统 随着智能制造成为企业转型升级的重点,将聪明的机器人放入复杂的制造业, 实现大规模的柔性生产,单凭一“人”之力是远远不够的。管理一个聪明的机器人团队,使它们汇集在一起高效协作,则不是件易事。 处于AI Cloud框架中边缘域之一的RCS机器人调度控制系统(以下简称“RCS”),通过融合运
[机器人]
英特尔发布 Gaudi 3 AI 芯片:性能超越英伟达 H100,第三季度上市
在4月9日晚的 Vision 2024 活动中,英特尔发布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 系统大批量上市。 据介绍,新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,但成本却低得多(IT之家注:H100 已经是英伟达上一代产品,英特尔并未与最新的 Blackwell 系列产品进行对比)。 此外,英特尔还为其数据中心 CPU 产品组合推出了全新品牌命名:原代号为 Granite Rapids 和 Sierra Forest 的芯片现在将被称为 “Xeon 6” 系列。这些芯片计划于今年上市,并将支持全新性能提升的标准
[嵌入式]
英特尔发布 Gaudi 3 <font color='red'>AI</font> 芯片:性能超越英伟达 H100,第三季度上市
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved