微软不断突破语音技术,助力加速各行业发展

发布者:ShiningSmile最新更新时间:2020-04-28 来源: eefocus关键字:微软  语音技术  人工智能 手机看文章 扫描二维码
随时随地手机看文章

人工智能如今已经家喻户晓,从日常生活到行业赋能,都可见其存在。在这之中,伴随着智能音箱等单品的爆发、语音交互的普及,AI语音技术也走进大众视野。历经近30年的探索,微软AI语音性能已达到全球领先水平,AI语音技术服务遍及140个国家和地区。


从2017年在Switchboard语音识别基准测试中以低至5.1%词错率创造当时对话语音识别错误率最低纪录以来,微软AI语音技术不断解锁新成就:成为首个在中译英新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统;带来媲美人类专业发音人水平的基于深度神经网络的语音合成技术;2019年,在斯坦福文本理解任务中,微软机器阅读理解系统刷新记录,成为排行榜上唯一一个超过人类分数的模型。


谈及此,微软(亚洲)互联网工程院资深产品总监丁秉公说道:“对于微软来说,我们要让更多的研究成果走出实验室,不仅要输入到微软的各个产品中,而且还要通过提供先进的工具和平台服务,让合作伙伴和开发者获得可打造自己的人工智能产品和解决方案的能力,这也是微软语音研发的一个定位。”


疫情当下,为助力企业高效恢复生产,微软围绕Azure、Office 365、Dynamics365 智能云服务和Surface硬件,推出了多项免费及优惠措施。本次微软还在疫情期间面向有需要的企业、政府机构和开发者推出免费语音服务,包括语音识别、语音合成、语音评估服务。


微软AzureAI语音服务平台的功能已经渗透到各个领域和应用场景。据悉, AI语音在疫情期间可以有着广泛应用,譬如可以应用于通过防疫智能外呼,进行社区情况排查和通知,回访协助政府排查疫情;利用智能语音导航与智能客服,解答用户的问题,协助用户办理业务,同时启动智能客服表单服务,帮助企业和政府收集和记录信息。

微软语音技术不断突破,助力加速各行业发展

实现智能医疗,助力医院智慧化建设,通过图片分析/人脸识别,声音合成,语音识别/声纹识别,语言理解/信息搜索等功能,实现患者与医务人员、医疗机构、医疗设备之间的互动。可与多种医疗数据整合,构建智慧医疗体系;以及在疫期利用AI语音合成系统将文字内容转成有声书,提高学习娱乐体验。


对此,丁秉公也表示:“我们在由世纪互联运营的微软Azure云上推出了面向中国用户的语音服务,助力复工复产复学,让企业可以更好地把握未来数字化转型机遇,让公共部门更有效率,让个人成为技术创新的受益者。”


几十年来,微软一直从事着与人工智能相关的技术研发,微软全球人工智能首席技术官,原微软首席语音科学家黄学东此前更是在采访中指出,语音和语言技术是AI皇冠上的明珠。在万物互联的5G时代下,随着低延时、低功耗、高带宽的到来,语音交互也将会成为一个主流。


“伴随语音技术更加成熟,应用场景越来越丰富,语音交互通过定制也将可以达到更加卓越的效果。这里包括两个层面,就语音识别来说,一个语音识别系统的识别精度会受到领域相关的词汇影响很大。通过定制,就可以针对某一个领域的专业词汇,让它的识别精度在原有通用模型的技术上变得很高,还可以针对每一个人的这个口音进行定制。另外一个方面来说,微软语音合成的定制可以为企业定制从男女,到不同年龄的丰富音色,甚至对于同一个音色我们可以定制各种的风格。” 在谈到不断优化的语音交互体验时丁秉公说道,“因为5G时代的网络会比现在更加快更加好,联上网一定会有很好的网络服务,所以基于这两点,我相信整个语音的应用会有一个爆发式增长。

作为一家全球公司,微软语音也是支持了世界上的主要语种,其中语音识别技术支持39个国家与地区的语言、语音合成技术支持80个多语言发音以及翻译支持60种语言互译。同时,Azure拥有全球覆盖最广的数据中心,所以微软语音语种的全球覆盖加上Azure云的全球覆盖保证了微软和其生态伙伴能够一起赋能世界上的每一个人和每一个组织。


丁秉公认为,中国AI语音创新无论是在技术、产品上,还有商业模式上都会有特别大的潜力。语音技术也将因此走进千家万户让普罗大众,特别是包括视障和听障人士,都可以享受到技术带来的益处。并且,未来语音技术也将越来越会像空气一样,融入日常生活。只要对着一个东西,一个设备,一个服务去说话,就能够被理解并得到响应和互动。


微软CEO萨提亚·纳德拉曾在微软Ignite大会上写了一个公式叫 technologyintensity (技术密集)= (tech adoption 技术落地x tech capability技术能力)^ Trust(信任)。所谓的技术密集就是随着数字化的不断深入,企业可以利用数字工具和平台结合行业和自身的特点开发专有技术、产品和服务,以迎接不断涌现的新机遇和新突破。为了打造一流的技术密集未来,微软语音研发团队的目标是让语音技术的能力能够实现跨领域、跨语言、跨用户的不断提高同时增加技术落地赋能,让每个企业和个人能通过技术实现繁荣发展;最后是发展可信赖和负责任的技术,这也是其最珍视的技术底线。


丁秉公表示:“希望微软语音技术可以帮助中国的AI生态走得更远更好。帮助更多的中国企业走出去,也可以帮助国外的企业走进中国,享受无缝的语音服务,没有语言的障碍。这次疫情也让我们更加感受到世界各国的联系其实远比许多人所想象得更紧密。在这个地球村,我们需要来共同应对和解决关乎人类共同命运的问题。我们也希望微软的语音技术能够帮到大家。”

关键字:微软  语音技术  人工智能 引用地址:微软不断突破语音技术,助力加速各行业发展

上一篇:小家电市场在疫情期间如何实现持续增长?
下一篇:指纹识别技术在各种电子设备中的应用

推荐阅读最新更新时间:2024-10-18 10:46

微软人工智能语音技术专利解密
据新华社报道,美国微软公司新近申请专利的一项人工智能语音技术或令人们能够与逝去的亲友对话。   英国《泰晤士报》报道称,相比于传统技术通常从大量使用者对话样本中搜集数据,用以训练聊天机器人,微软的这项技术利用某个具体人物留下的图像、声音、社交媒体帖文、手写书信等 “社交数据”,生成关于此人性格的数据档案。   IT之家获悉,微软提交的专利申请表明,这些数据 “可用于训练聊天机器人以特定人物的性格对话或互动”,凭借录音或声音数据,聊天机器人甚至能够模仿某个特定人物说话的声音。   专利显示,还可利用与某个特定人物相关的图像、深度信息和视频数据生成此人的二维或三维形象,配合聊天机器人使用。   不过,为一项新技术申请专利并不
[手机便携]
那个最不像AI语音助手,离开了微软创业
传闻近一个月的微软小冰分拆终于敲定。   7月13日一早,微软中国发布官方公告,宣布将人工智能小冰业务分拆为独立公司运营,并委任沈向洋博士为新公司董事长,‘小冰之父’李笛为首席执行官,日本和印尼两地 Rinna(小冰)的负责人陈湛为日本分部总经理,微软将保持对新公司的投资权益。   谁是小冰?   小冰诞生于 2014 年,是微软旗下的对话机器人。和普遍意义上的问答机器人不同的是,小冰从诞生之初就瞄准‘有情感、会闲聊’的方向,主打情感计算。近年来小冰出现在公众视野中,常常是因为其绘画、诗歌、音乐等艺术方面的创作。在刚刚闭幕的上海世界人工智能大会上,小冰还和小米小爱同学、百度小度、虚拟主播泠鸢共同演唱了主题曲。   小冰
[手机便携]
微软为下代HoloLens开发AI芯片 可识别语音和图像
  关于下一代  HoloLens , 微软 终于透露了一些消息:正在研发 AI 芯片,使其识别语音和图像。下面就随网络通信小编一起来了解一下相关内容吧。   微软为下代HoloLens开发AI芯片 可识别语音和图像   日前,在夏威夷举办的 CVPR 大会上, 微软 对外公布,他们正在为  HoloLens  开发新的 AI 芯片,使设备可直接识别用户所看的事物和听见的声音,将数据传回云端时也不会产生更多的延时。   据雷锋网了解, 微软  Holographic Processing Unit (HPU,全息处理器)二代正在研发中,将用于下一代  HoloLens ,但并未给出明确时间。   上一次微软宣布 Holole
[网络通信]
微软为下代HoloLens开发AI芯片 可识别语音和图像
关于下一代 HoloLens,微软终于透露了一些消息:正在研发 AI 芯片,使其识别语音和图像。 雷锋网(公众号:雷锋网)拍摄于 CVPR 现场 日前,在夏威夷举办的 CVPR 大会上,微软对外公布,他们正在为 HoloLens 开发新的 AI 芯片,使设备可直接识别用户所看的事物和听见的声音,将数据传回云端时也不会产生更多的延时。 据雷锋网了解,微软 Holographic Processing Unit (HPU,全息处理器)二代正在研发中,将用于下一代 HoloLens,但并未给出明确时间。 上一次微软宣布 Hololens 全息处理器还是2016年8月。一代 HPU 芯片采用台积电 TSMC 代工定制
[嵌入式]
<font color='red'>微软</font>为下代HoloLens开发<font color='red'>AI</font>芯片 可识别<font color='red'>语音</font>和图像
微软不断突破语音技术,助力加速各行业发展
人工智能如今已经家喻户晓,从日常生活到行业赋能,都可见其存在。在这之中,伴随着智能音箱等单品的爆发、语音交互的普及,AI语音技术也走进大众视野。历经近30年的探索,微软AI语音性能已达到全球领先水平,AI语音技术服务遍及140个国家和地区。 从2017年在Switchboard语音识别基准测试中以低至5.1%词错率创造当时对话语音识别错误率最低纪录以来,微软AI语音技术不断解锁新成就:成为首个在中译英新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统;带来媲美人类专业发音人水平的基于深度神经网络的语音合成技术;2019年,在斯坦福文本理解任务中,微软机器阅读理解系统刷新记录,成为排行榜上唯一一个超过人类分数的模型。 谈及此
[嵌入式]
<font color='red'>微软</font>不断突破<font color='red'>语音</font><font color='red'>技术</font>,助力加速各行业发展
罗克韦尔自动化与微软拓展合作伙伴关系,运用生成式 AI 技术提升生产力并缩短产品上市
( 2 0 23 年 10 月 3 1 日,中国 上海 ) 罗克韦尔自动化公司与微软公司(纳斯达克上市代码:MSFT)近日宣布拓展双方的长期合作伙伴关系,致力于通过生成式人工智能 (AI) 加速工业自动化设计和发展。 双方将结合各自技术专长,赋能工业自动化系统制造商提升劳动力,缩短产品上市时间。此次合作的首个成果是将微软的 Azure OpenAI 服务集成至罗克韦尔自动化的 FactoryTalk® Design Studio™,这项业内领先的技术,能帮助工业自动化系统制造商将产品更快地推向市场。 “熟练工短缺以及随之而来的生产力损失是工业企业及其服务提供商目前面临的重大挑战。如果服务提供商的生态圈不能在预算范围内按时
[工业控制]
重磅!索尼携手微软,将Azure人工智能技术注入全新传感器
据悉,近期索尼将与微软合作开发一项企业服务,该服务可利用人工智能(AI)分析图像,将索尼的图像传感器和微软的AI相结合,可以通过云处理的方式从相机中获取信息。 但是与传统的分析处理不同的是,该服务可将整个流程变得更加高效。它可以大大减少数据量并快速处理它,同时降低电量消耗,索尼与微软打算将此服务卖给零售业和制造业以促进AI的传播。 索尼与微软将在一年内将两家公司的技术相结合,并提供到客户的公司云平台。在此之前,索尼开发了配备有AI处理功能的图像传感器,这对于服务至关重要。除此之外,该传感器还整合了微软云服务“Azure”中强大的AI功能。 一般情况下,该服务通常负责云端和服务器的图像识别等数据分析,特殊情况下其中一部分在传感器阶段
[机器人]
AI换脸鉴别率超99.6%,微软技术破除DeepFake虚假信息
此前DeepFake换脸在全球引发轩然大波。从生成足以以假乱真的名人不雅视频开始,很多使用者将这个“换脸神器”当成了视频造假工具,并通过社交网络将虚假信息传播到全世界。DeepFake等技术出现不仅提升了换脸的真实性,其开放源代码的方式更是降低了将该等技术滥用于虚假信息制作和传播门槛。 事实上,大约30%经过AI换脸的合成照片、合成视频是人类仅凭肉眼无法识别的,很容易被当作真实信息进行再次传播。这已成为一个亟待解决的社会性问题,面对这个问题,我们应该以及可以做些什么?微软亚洲研究院给出了解决方案。 除了DeepFake,市场上存在多种换脸技术,不同算法生成的图像结果千差万别,难以使用同一个换脸鉴别模型解决所有换脸技术的进攻。与
[传感器]
<font color='red'>AI</font>换脸鉴别率超99.6%,<font color='red'>微软</font><font color='red'>技术</font>破除DeepFake虚假信息
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved