人工智能在语音系统中起到了很大的作用。据报道,谷歌推出来一款文字转语音系统,具有极高的发音准确性,并且合成语音与真人声音难以区分。
据国外媒体报道称,如果按照最新的标准来看,人类似乎已经将自己的“声带”正式献给了人工智能。这可并不是笔者在这儿危言耸听,而是谷歌本月开创性地推出了一款名为“Tacotron 2”的全新文字转语音系统,它具有惊人的发音准确性,且实际文本阅读效果几乎同真人声音无法区分。
消息称,“Tacotron 2”其实已经是谷歌的第二代类似技术,它由两个深度神经网络组成。其中一个负责将文本转换为可视化的图谱(通常是PDF格式),然后再将这个生成的这个可视化图谱载入第二个深度神经网络WaveNet(这个神经网络是从DeepMind实验室孵化而来),并将其还原为一个真实的声音。
目前,该系统只进行了英语女声的训练(如要需要它发出男性声音的话,谷歌则需要对其进行重新“培训”)。谷歌的研究人员表示,“Tacotron 2”完全可以准确发音一些非常复杂的单词和人名,并根据标点符号的不同而有所区分,甚至能够完美地讲完一段绕口令。举例来说,“Tacotron2”会默认在读到大写单词的时候加重语气,也能够处理少量的人为打字错误。
同谷歌正在研发的其他核心AI技术不同,“Tacotron 2”不仅仅是某种一直停留在实验室阶段的技术,而是将对公司其他产品起到立竿见影的作用。举例来说,谷歌实际上已经将深度神经网络WaveNet用于在GoogleAssistant中生成更为真实的语音反馈。而一旦这一产品在未来迎来进一步完善后,它显然会对提升谷歌其他产品的用户体验提供更大帮助。
需要指出的是,所谓“语音合成技术”又称文本转语音(TTS)是如今很多移动产品和应用上不可或缺的技术模块,例如语音交互应用、导航、语音控制以及为视力障碍者设计的产品中都需要语音合成技术的支持。在此之前很长一段时间内,语音合成技术都是采用拼接方式,需要记录大量语料才能进行语音合成。这样的方法不仅前期需要处理大量数据,而且一旦说话人有所改变就需要重新记录和处理,所以业界一直在寻找可以实时生成语音的方式。
对此,谷歌旗下DeepMind实验室在2016年就推出了WaveNet深度神经网络,该网络在经过真实语音训练后可以根据文本直接生成音频。在过去12个月中,DeepMind一直在努力大幅度提高模型的速度和质量,用于“生成能够产生比现有技术更好、更逼真的,语音原始音频波形”。
关键字:语音系统 AI 谷歌
引用地址:
谷歌语音系统AI新科技:同真人声音无法区分
推荐阅读最新更新时间:2024-05-03 20:12
全球领先系统制造商推出 NVIDIA AI 就绪型服务器,为企业大幅提升生成式 AI 性能
戴尔科技、慧与和联想即将推出采用 NVIDIA L40S GPU 和 NVIDIA BlueField 的服务器,以支持 VMware Private AI Foundation with NVIDIA 拉斯维加斯 — VMware Explore — 太平洋时间 2023 年 8 月 22 日 — NVIDIA 今日宣布,全球领先的系统制造商将推出 AI 就绪型服务器,其支持同于今日发布的 VMware Private AI Foundation with NVIDIA,帮助企业使用自有业务数据来定制和部署生成式 AI 应用。 NVIDIA AI 就绪型服务器将采用 NVIDIA® L40S GPU、NVIDIA
[工业控制]
平头哥半导体发布首款AI芯片含光800
平头哥半导体有限公司于2018年10月31日成立,法定代表人刘湘雯,是阿里巴巴旗下半导体公司。平头哥半导体将打造面向汽车、家电、工业等诸多行业领域的智联网芯片平台。前期由阿里扶持,后期平头哥将会独立化运作,自负盈亏。 在2019年杭州云栖大会上,平头哥半导体发布了阿里的首款AI芯片——含光800,该芯片是一款云端AI芯片,也是全球最高性能的AI推理芯片。 据悉,含光800AI芯片是阿里巴巴第一款正式流片的芯片,主要应用于云端视觉处理场景,性能打破了现有AI芯片记录,性能及能效比全球第一。 据了解,平头哥用7个月完成了前端设计,之后用3个月就成功流片。 早前,在今年7月的阿里云上海峰会上,平头哥发布了高性能
[嵌入式]
谷歌Pixel 6系列支持33W快充
快充如今已经成为了多数手机品牌的标配。 像小米、iQOO、OPPO、realme、一加等机型都已经支持超级快充,其中小米MIX 4、iQOO 8 Pro等支持120W超快闪充,OPPO Find X3系列、一加9系列支持65W超级快充,充电速度非常之快。 相比之下,苹果、谷歌这两家巨头对快充没有国产手机品牌那么激烈。 以谷歌为例,其去年发布的Pixel 5随机配备的充电器输出功率为18W,而谷歌Pixel 5a的电池容量为4080mAh,用18W快充给Pixel 5充电,其速度可想而知。 如今谷歌即将发布Pixel 6系列,慢充局面终于有所改观。 8月20日消息,据91Mobile报道,谷歌Pixel 6
[手机便携]
Nauto推出AI碰撞预测警报系统 可避免追尾事故
据外媒报道,现在,车队在对抗分心驾驶的战斗中可以获得一个新工具——Nauto的碰撞预测警报(Predictive Collision Alerts)。该公司刚刚将该新模块添加至其基于AI的驾驶员行为学习平台中。碰撞预测警报同时融合了驾驶员行为、车辆移动情况、交通元素以及背景数据,帮助预测和预防碰撞事故的发生。 (图片来源:Nauto) Nauto表示,碰撞预测警报的工作原理与人脑类似,能够在多任务卷积神经网络模型中不断综合车辆内部和周围环境输入的信息,以确定碰撞风险水平。当探测到风险加剧时,碰撞预测警报会向驾驶员发送信号,而且警报会呈现越来越紧急的态势,以要求驾驶员采取行动。 据Nauto所说,与传统方法相比,该新模块可
[汽车电子]
英特尔首发大型神经拟态系统Hala Point,推进“绿色AI”发展
英特尔发布了代号为Hala Point的大型神经拟态系统。Hala Point基于英特尔Loihi 2神经拟态处理器打造而成,旨在支持类脑AI领域的前沿研究,解决AI目前在效率和可持续性等方面的挑战。在英特尔第一代大规模研究系统Pohoiki Springs的基础上,Hala Point改进了架构,将神经元容量提高了10倍以上,性能提高了12倍。 英特尔研究院神经拟态计算实验室总监Mike Davies 表示:“目前,AI模型的算力成本正在持续上升。行业需要能够规模化的全新计算方法。为此,英特尔开发了Hala Point,将高效率的深度学习和新颖的类脑持续学习、优化能力结合起来。我们希望使用Hala Point的研究能够在大规
[嵌入式]
碎片化令Android自取灭亡 谷歌欲断臂自救
虽然Android操作系统目前拥有着极大的市场份额,但碎片化问题已经越来越严重的威胁到了谷歌的利益。对此,谷歌给出的解决方案是“终结Android品牌,并以谷歌取而代之”。以下是文章主要内容: 也许是三星Galaxy品牌的崛起,也许是亚马逊的Kindle设备完全抹杀了Android的系统印记,现在的谷歌似乎正在一步步终结自己的Android品牌,并开始用自己的细分品牌取代前者的地位。那么,谷歌能够最终摆脱Android,并继续保持自己的发展势头吗? 尽 管谷歌的Android操作系统目前拥有着极大的市场份额,但谷歌一直面临的一个问题是,随着越来越多的手机生产厂商和运营商开始拥抱这一系统,市面上已 经出现了越来越多的And
[手机便携]
禁止谷歌、苹果应用商店强制收费!韩国会通过“反谷歌法
韩国国会周二(31日)通过一项电信商业法修正案,这将使得韩国成为第一个限制谷歌和苹果应用商店对软件开发者强制收取佣金的国家。 据路透社报道,这项被称为“反谷歌法”的法案最终在188名参加投票的议员中获得180人赞成通过,一旦得到文在寅总统的签署,就会成为法律正式生效。而文在寅所在政党一直是该法案的支持者。 苹果和谷歌的强制收费政策通常要求开发者向其支付每笔交易高达30%的佣金。“反谷歌法”的通过,意味着开发者可以引导用户在其他平台付费而避免向谷歌、苹果等主要应用商店运营商支付佣金。 热门软件Tinder开发商Match Group发言人表示,法案的通过标志着在争取公平的应用生态系统的斗争中迈出了具有里程碑意义的一步。代表韩国IT企
[手机便携]
“智慧”机器人:中医+人工智能
未来中医诊疗将是这样的场景:一面镜子成为智能检测设备,早晨起床照镜子时就能查看目色、脸色、舌色,“人工智能”会分析并预测个人健康状况;拥有古今名医大数据“智慧”机器人,“望闻问切”为患者辨别症状;智能设备一边掌握着实时人体数据,一边开展针灸、艾灸等治疗。 近日我国首个中医领域“人工智能+装备”研究机构——成都中医药大学国家中医智能装备研究院运行,中医辨症论治过程、中医基础理论如何与人工智能、大数据等现代科学结合,令人耳目一新。日前,记者就此进行了采访。 中医“经验”是种“大数据” 作为成都中医药大学与博奥生物集团有限公司(生物芯片北京国家工程研究中心)联合设立的研发与临床验证机构,新成立的研究院将挂靠成都中医药大学。按照双
[医疗电子]