雷锋网按:会话转录能够实时进行?而且还支持多人、远场语音转录?是的,这些新的转录功能都是微软研究所近期在口语处理上取得的新进展,雷锋网将其文章全文编译如下。
在强大的云计算基础设施和大量训练数据的支持下,深度学习算法如今已经成为了 AI 进化之旅的最重要驱动力。下面的几个任务是语音和语言社区里广泛使用的公开基准测试,在过去的三年里,微软首次在这些任务上取得了可以和人类相媲美的表现。
2017:语音识别:对话语音转录任务(总机)
2018:机器翻译:汉英新闻翻译任务(WMT17)
2019:对话问答:斯坦福会话问答任务 (CoQA)
这些突破对从翻译应用到智能扬声器的众多口语应用产生了深远的影响。虽然现在市面上已经有了智能音箱,但大多数智能音箱一次只能处理一个人的语音指令,并且在发出这样的指令之前,需要一个唤醒词。微软研究在Azure语音服务中加入了一些重大的技术突破,并提供了新的对话转录功能,该功能将在今天的预览版中提供。通过微软所引用的设备SDK (DDK),纯音频或视听麦克风阵列设备的可用性增强了这一功能。这是人工智能进化过程中的重要一步,因为几十年来,环境远场多人语音转录一直是科幻小说的主要内容。
新的会话转录功能扩展了微软现有的Azure语音服务,支持实时、多人、远场语音转录和说话人归因。与语音DDK相结合,会话转录可以有效地识别房间里一小群人的会话语音,并生成一个处理常见但具有挑战性的场景(如“串话”)的转录。
对于有兴趣尝试具有视频功能的端到端转录解决方案的客户,微软正在与部门客户和像Accenture、Avanade和Roobo这些的系统集成伙伴接洽,分别在美国和中国定制和整合对话转录解决方案。这种先进的能力类似于微软在去年的构建中首次演示的功能。感兴趣的企业可以向微软申请预览,体验由人工智能支持的对话转录是如何提高协作力和生产力的。
微软不断创新去超越传统的麦克风阵列和先进的视听麦克风阵列DDKs。今天,微软还公布了最新的研究进展(丹麦项目),该项目利用一组现有的设备,如配备普通麦克风的手机或笔记本电脑,动态创建虚拟麦克风阵列。虚拟麦克风阵列将现有设备(如手机或笔记本电脑)与普通麦克风(如乐高积木)动态地组合成一个更大的阵列。丹麦项目可以帮助微软的客户更容易地使用Azure语音服务,随时随地转录对话,无论有没有一个专门的麦克风阵列DDK。未来的应用程序场景是非常广泛的。例如,我们可以对多个微软翻译器应用进行配对,以帮助多人更有效地使用移动电话进行沟通,从而将语言障碍降到最低。可以在//Build Vision Keynote查看最新研究进展和演示。
【 图片来源:
Microsoft Research Blog
所有者:Microsoft Research Blog 】
最后,如果有像缩略语这样的专业词汇,准确的语音转录是非常困难的。为了解决这个问题,微软正在扩展Azure的自定义语音识别功能,并允许组织使用Office 365数据轻松地创建自定义语音模型。对于选择使用该服务的Office 365企业客户,Azure可以自动生成一个自定义模型,该模型利用Office 365中的联系人、电子邮件和文档等数据,以一种完全隔离、安全且兼容的方式进行操作,在组织特定的方言上提供了更准确的语音转录,如技术术语和人员姓名。对于有兴趣尝试这个新功能的客户,微软将为您的组织提供一个私人预览,让您从专用的和优化的语音服务中获益。
【 图片来源:
Microsoft Research Blog所有者:Microsoft Research Blog 】
微软的Azure语音服务一直支持微软自己的M365解决方案以及许多使用相同统一语音平台的第三方客户。从Allstate到小米,都开始利用Azure语音服务来加速他们的数字化转型。 微软可以使用NLP技术进一步增强最终的自动会议记录和Azure会话转录,例如机器翻译、QA,去帮助客户实现更多目标。
关键字:微软 AZURE 麦克风阵列
引用地址:
会话转录可以实时进行?微软研究新进展告诉你答案
推荐阅读最新更新时间:2024-10-12 18:33
微软手机业务不景气 商店即将销售华为Mate 10 Pro
作为国内数一数二的手机厂商,华为的年度旗舰HUAWEI Mate 10 Pro在产品本身取得巨大成功之后开始追求市场上的突破,开始攻克欧美市场。 HUAWEI Mate 10 Pro 近日,有外媒爆料,微软商店可能即将销售HUAWEI Mate 10 Pro,虽然微软商店隶属于微软旗下,有自己的手机业务,但是由于WP手机一直不景气,微软也开始贩卖别家的手机。 微软商店销售手机 早在去年,微软就在在线商店销售三星盖乐世 S8和S8 Plus。而自家的手机则一直处于“被剥削”的状态。 如果微软商店开始售卖HUAWEI Mate 10 Pro,相信会为华为攻克欧美市场助一大波力。
[手机便携]
密码成为被淘汰的落后技术 微软将支持用手机解锁电脑
在移动互联网时代,网络生活越来越便捷,但是一种古老的数字遗产——“账号密码”却成为用户的最大掣肘。许多业内人士指出,账号密码这种古老的技术早应该被淘汰。 据外媒最新消息,微软将逐步开始在Windows操作系统中淘汰账号密码,其中下一个版本的Windows10 S将支持用手机解锁。 据华盛顿邮报、AppleInsider等新闻媒体报道,微软日前表示,在新版的Windows10 S中,系统将默认取消密码,如果按照操作系统的选项进行设置,用户无需像过去那样设置密码。 不过,微软要彻底淘汰密码这种古老的技术,还需要很长的时间。 在取消电脑系统密码之后,微软将允许在iPhone或是安卓手机上安装一个“微软验证器”(Micro
[家用电子]
微软发布邀请函 将于10月3日举行VR/AR发布会
在过去几年中,微软通常会于10月下旬在纽约举办一场引人注目的新品发布活动,向世界推出其新款Surface电脑和其他设备。不过,美国主流网络媒体BI了解到,微软今年打破了这个传统。微软不会举办大型发布会,而是保持低调,并在整个10月份不断发布新闻。而且按照这个思路去猜测,在2017年的剩余时间里,微软也不太可能发布更大、更新的产品。 微软刚刚发布邀请函,宣布将于10月3日(Google举办硬件发布会的前一天)在旧金山举行发布会,重点在于虚拟现实(VR)和增强现实(AR)。此次活动将由亚历克斯·基普曼(Alex Kipman)发表主题演讲,他是微软技术院士(Microsoft Technical Fellow),曾发明了HoloL
[家用电子]
从手机到手环,微软为啥玩一个砸一个?
微软 已经从官方商城下架 手环 产品不再售卖,这是微软意图砍掉手环产品线的讯号。
很可惜,现在你已经无法在微软官方商城购买到微软Band 2手环了。其他第三方电商也都同步下架,只有亚马逊还在兜售少量库存。根据外媒ZDNet消息,微软已经放弃了发布Band 3的计划,微软手环产品线团队也已经解散。
在月初的时候,微软还声称将“继续为用户提供优质的可穿戴产品”。不过从目前的情况看,Band系列已然被抛弃,甚至连官方开发者套件都被禁止访问。(这表示已经没有人能为Band编写应用App了)
第一代Band手环发布于2014年10月,在当时的市场上也算是独领风骚,但在佩戴舒适感上为人诟病。去年
[嵌入式]
HomePod的危机!微软似乎正在打造智能扬声器?
据德国网站WinFuture的一份最新报告显示, 微软 似乎正在打造自己的 智能扬声器 ,它由Cortana和Windows 10 IoT提供动力,搭载了高通骁龙Qualcomm Snapdragon 212处理器。 这个想法还处于早期阶段,但如果发生这种情况,微软最终会有一个和 苹果 HomePod竞争的产品。消息来源称,微软正在与广达合作这个新项目,但该项目仍处于早期阶段,在批量生产之前,很多情况都可能发生变化。这款扬声器可能在2019年秋季推出。
[嵌入式]
窥探AI巨头的人才争夺战:员工互换已陷入死循环
最近发布的一份报告显示,在过去五年中,亚马逊一直在与谷歌和 微软 合作,参与了一项由 AI 开发者提供的“移动设备”。事实证明,这三家公司都倾向于定期从对方那里挖走人才。下面就随网络通信小编一起来了解一下相关内容吧。 上个月,亚马逊到处寻找机会来填补自己的人工智能职位空缺,而今天,仅在人工智能招聘网站上就有140个职位空缺。根据职业网站Paysa的说法,这对亚马逊来说是正常的,亚马逊一直在努力抓住尽可能多的 AI 人才,同时也会有同样数量的员工被其他公司挖走。 窥探AI巨头的人才争夺战:员工互换已陷入死循环 这种事情在 微软 尤为的明显, 微软 似乎已经陷入了一个员工互换的死循环之中。据统计,微软位于雷德
[网络通信]
赶尽杀绝 微软宣布关闭Nokia X产品线 将其并入Lumia品牌
微软今日在宣布裁员18000人的同时还宣布了一个意料之外的消息,公司将诺基亚在最后时刻建立起的Nokia X Android产品线关闭,并将已有的产品并入Lumia品牌,此前,Nokia X被诺基亚称为一个“伟大的Android尝试”。在做出产品线调整的同时,微软还将继续支持之前的Nokia X系列产品。 本次调整也意味着微软彻底放弃了诺基亚之前在Android系统的融合尝试。 微软表示,Nokia X今后将称为Lumia产品线的一部分,同时产品的设计重心也将调整为运行Windows Phone,这有助于巩固微软在中低端智能手机领域的成功,并让微软和合作伙伴能够专注于开发Windows通用应用程序。 有趣的是,以上
[手机便携]
微软获ARM公司新授权允许自主开发处理器
据国外媒体报道,微软周五与ARM签署了新的Arm微处理器架构授权协议。将来,微软很可能效仿苹果开发自己的基于ARM架构的处理器。 此前,微软和ARM在软件、手机和嵌入式产品方面已经有过多年合作,而新的授权协议将进一步拓展微软能够使用的ARM技术。 ARM执行副总裁伊恩·德鲁(Ian Drew)称:“我们已经向微软授权了架构和指令集,这类授权允许被授权方设计自己的微处理器架构。”除了微软,高通、英飞凌和Marvell Technology等多家公司已经获得了此类授权。 微软在一份声明中称:“ARM是微软的重要合作伙伴,我们为ARM架构提供了多套操作系统,如Windows Embedded何Windows Ph
[半导体设计/制造]