谷歌AI新突破:实时聊天中识别“谁说了什么”正确率高达92%

发布者:BlissfulDreams最新更新时间:2018-11-13 来源: cnBeta关键字:谷歌  AI 手机看文章 扫描二维码
随时随地手机看文章

分割聚类(Diarization)是指根据“谁说了什么”将多人语言样本分割成相应的碎片段,再对所有碎片段进行聚类,把属于同一个说话人的片段都聚在一起,标注出这些碎片段属于谁。对于机器来说整个处理过程并不能像人类那样得心应手,而且机器学习算法的培训也要比想象中的更难。一个强大的分割聚类系统还要识别出此前并未关联的新语音碎片段。



        不过朝着高性能模式发展的道路上,谷歌的人工智能研究部门已经取得了令人鼓舞的突破性进展。在最新发表的论文“Fully Supervised Speaker Diarization”[PDF]以及官方博文中,谷歌研究人员描述了一种全新的人工智能系统,能够让系统以更又有效的方式来使用声音样本标签。



        这篇论文的核心算法在 NIST SRE 2000 CALLHOME的跑分中,能够在实时语音聊天应用中将在线分割聚类错误率(EDR)降低至7.6%。而谷歌此前在GitHub上开源的方式EDR为8.8%。谷歌研究人员的新方法就是通过递归神经网络(RNN)模拟说话者的输入(例如用数字方法表示说话者的单词和短语),这种机器学习模型类型能够使用内部状态来处理输入序列。




关键字:谷歌  AI 引用地址:谷歌AI新突破:实时聊天中识别“谁说了什么”正确率高达92%

上一篇:想与高通抗衡?Intel提前半年发布XMM 8160 5G基带
下一篇:1.39亿美元!英飞凌宣布收购Siltectra,有望将晶圆生产芯片数

推荐阅读最新更新时间:2024-05-03 18:54

为抵制军事项目合作 十几名谷歌员工正集体请辞
据外媒报道,为了表示对公司与五角大楼展开的人工智能合作项目“Maven”的不满和抗议,十几名谷歌员工正在集体请辞。 据了解,“Maven”项目是使用机器学习来识别无人机镜头中的车辆和其他物体,从而减轻分析人员的负担。 按照五角大楼的说法,这一项目的最初目标是为美国防部提供先进的计算机视觉,从而自动检测和识别无人机全动态摄像机捕获的多达38种物体。 其中,谷歌为国防部提供了用于机器学习应用的TensorFlow API,以帮助军事分析人员检测图像中的物体。另外,在声明中,谷歌方面也承认了“使用机器学习用于军事目的”是具备争议性的,为此,他们正在围绕其使用开展“制定政策和保障措施”。 不过,这一声明并没有缓解一些谷歌的员工的愤怒。
[机器人]
人工智能大热 商用机器人或迎来风口
  人工智能的发展方兴未艾,而使用其技术的商用 机器人 也似乎在一夜之间火了。   但谁都没想到,这一切是拜马云的“无人零售”这个新物种所赐。在人工智能技术和无人零售这两个概念的双重加持下,商用机器人的元年或已到来。   据前瞻产业研究院《中国 服务机器人 行业发展前景与投资分析报告》显示,目前,全球商业 机器人市场 总值正以每年20%~30%速度增长,预计到2017年规模将达到461.8亿美元,其中,在中国商业机器人的市场,2017年的规模也将达到240亿元人民币。   正如李开复所说, 工业机器人 是机器人发展的第一个阶段。争夺激烈的下一个焦点将是——商用机器人领域。如今, 机器人技术 和市场环境已经可以充分满足商用需求。  
[嵌入式]
EA的AI机器人已经会玩战地了
电脑游戏玩家们可能对“AI”毫不陌生,不过游戏中的AI或许只是人工而缺了一点“智能”。它们是一个按照预先编程的行动的对手或者队友。不过最近EA打算将真正的人工智能用在游戏上面。 在今日的GDC游戏大会上,EA宣布正在通过FPS大作战地1训练他们的AI 机器人 。EA表示这样做的最终目的是为玩家提供更强大、更真实的敌人,并帮助游戏开发人员调对游戏进行调试。 ▲EA的AI机器人游戏实况截图 因此EA的AI机器人和传统意义上的AI将是天差地别。它们将通过两种模式学习游戏技术:模仿学习和强化学习。正如字面意思,模仿学习意味着AI将会通过观看、模仿人类玩家的游戏操作。EA表示,这部分将占它们知识构成中的2%,并让它们走上正确的道路。 在上
[嵌入式]
告别晶体管迎来忆容器,AI芯片可用电场而非电流执行计算
运行生成式人工智能(AI)系统不仅硬件成本高昂,而且会带来惊人的能源消耗。据科技网站TechCrunch报道,总部位于德国的初创公司塞姆龙最新开发出一种创新的AI芯片设计方法,率先使用新的神经网络控制设备——忆容器为其3D芯片供电。这有可能彻底改变节能计算技术,使消费电子设备更容易获得先进的AI功能。 不同于处理器中的晶体管,塞姆龙的芯片使用电场而不是电流。这些由传统半导体材料制成的忆容器可存储能量并控制电场,不仅提高了能源效率,还降低了制造成本,使消费电子产品更容易运行先进的AI模型。 塞姆龙芯片是一种多层组织结构,核心原理是电荷屏蔽,通过屏蔽层控制顶部电极和底部电极之间的电场。屏蔽层由芯片内存管理,可存储AI模型的各种“权重”
[半导体设计/制造]
全球机器人产业规模越来越大 但谷歌把机器人弄糟了
  导语:谷歌于2013年涉足 机器人 研发,前后至少并购了九家公司,但没有一家被收购的企业制造出实用的 机器人 产品;而且在过去的几个月里,至少有三位2013年加入谷歌的 机器人 大佬离开公司。彭博社近日发表文章,讲述了谷歌涉足机器人的前后经历。下面就随工业控制小编一起来了解一下相关内容吧。   以下为文章全文:   1982年,电影《刀锋战士》(Blade Runner)让世界认识了复制人,导演雷德利·斯科特(Ridley Scott)为作家菲利普·K·迪克(Philip K. Dick)想象出来的类人机器人安上这个名字,向人类发出警示。在过去几年里,刀锋战士有了两位高调的继承者。一是由斯科特监制的续集《银翼战士2049》,
[工业控制]
计算光刻速度提高40倍,台积电预计6月将英伟达AI加速技术导入2nm试产
英伟达与台积电、ASML 和新思科技(Synopsys)携手合作,经历四年开发,英伟达终于完成全新的 AI 加速技术 cuLitho。据介绍,CuLitho 可以将下一代芯片计算光刻度提高 40 倍以上,使得 2nm 及更先进芯片的制造成为可能。 cuLitho 是一个用于运算式微影函数库,将可缩短先进制程芯片的光罩时程、拉升良率并大幅减低晶圆制造所需的能耗。 据台湾联合报,台积电将在今年 6 月对 cuLitho 进行生产资格认证,并完成 2nm 试产,用于提升 2 纳米制程良率,并缩短量产时程。 据介绍,用于计算光刻的全新 NVIDIA cuLitho 软件库已经被台积电和新思科技集成到其最新一代 NVIDIA Ho
[半导体设计/制造]
计算光刻速度提高40倍,台积电预计6月将英伟达<font color='red'>AI</font>加速技术导入2nm试产
海思Hi-IVE技术:人工智能化的初步尝试
    高清化、IP化、智能化是视频监控产业向前发展的核心逻辑。随着全球视频监控领导企业海思半导体HEVC/H.265+划时代产品即Hi3519处理器的上市,超高清的画质和低带宽的网络传输、存储与显示得以实现,解决了高清化和网络化带来的业界公认的“带宽、存储、显示”三大难题,必将引领整个视频监控产业进入一个新的发展时期。   视频监控作为安防的眼睛自然是越清晰越好,有了好的眼睛还需要灵活的大脑来处理所有数据。在高清化、IP化之后,如何让视频监控更智能是下一步发展的主要课题。海思半导体独创的“通用CPU+IVE硬件智能算法加速引擎”技术,将给视频监控行业注入新的技术推动力,开启智能视频监控的新纪元,也是人工智能化的初步尝试。   
[安防电子]
OPPO陈明永:AI不需要被神化 国际市场要深耕
电子网1月25日报道(记者 张轶群)在今天举行的“高通中国技术与合作峰会”上,OPPO CEO陈明永表示,AI不需要被神化,到头来还是要满足用户的核心需求。国际市场不能蜻蜓点水,要深耕。 谈及国际市场的开拓时,陈明永表示,不存在严格的海外和中国市场之分,好的产品是全球共同的语言。中国市场做得不错了,OPPO就逐步进入东南亚、印度等市场。但是每个市场不能蜻蜓点水,要深耕,做得不错,再下一个,顺理成章去延伸。接下来,OPPO将会进入日本和欧洲市场、为全球更多用户提供极致科技体验。 关于AI技术,陈明永指出,AI不需要被神化,到头来还是要满足用户的核心需求。OPPO在过去、现在、未来都在围绕用户的核心需求进行AI技术的应用,包括
[半导体设计/制造]
小广播
最新手机便携文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved