人工智能公司依图科技公布了在中文语音识别技术上的最新突破。在全球最大的中文开源数据库AISHELL-2中,依图短语音听写的字错率(CER)仅为3.71%,相比原业内领先者提升近20%,大幅刷新现有纪录。
除了傲人的成绩之外,此次依图还得到两家巨头企业的共同“点名”。其一,是与当前市值最高的企业微软Azure联合推出依图语音开放平台;其二,是携手“通信巨头”华为,发布“智能语音联合解决方案”。
依图首席创新官吕昊博士
近年来,深度学习的爆发驱动了语音识别技术的高速发展,但相较于人脸识别在准确率方面的高增速来说,语音识别的发展仍较为缓慢。尽管一些机构已宣传达到了人类水平,但大多数情况下都来自安静、近场等受限场景。对于电话、语音节目、远场等更复杂场景,理想和现实仍有较大差距。而在中文语音识别技术领域,汉语的博大精深带来的同音不同意等问题,更对语音识别的处理难度带来极大挑战。
依图首席创新官吴昊博士表示,“语音识别技术经历了漫长的发展进化,但至今都只能在受限的场景下才能达到较好的使用效果。我们认为,核心技术的突破,依然是当前破局中文语音识别发展的关键。在语音识别领域,依图科技是一名新生,但立志推动行业创新与发展,做世界最好的中文普通话语音识别技术。”
依图此次推出的中文语音识别算法,与业内原有领先者相比,不仅大幅提升了识别准确率,且在单个算法模型上,有极为出色的多场景适用性表现。在业内近期公开的AISHELL-2的三个测试子集,以及来自第三方的近场口音测试集、近场安静聊天测试集、语音节目测试集、电话测试集、远场测试集中,依图均处于业界领先水平,且字错率全部在15%以下。其中,在AISHELL2-2018A-EVAL数据集中,依图的识别准确率高达96.29%,字错率(CER)仅为3.71%,领先行业第二名约20%。通过“听写大会”微信小程序,让用户可以直观感受到语音识别技术的真实表现,在业界也属首次,公开透明的体验各类算法的水平差异。
语音识别是人人交互、人机交互最重要的入口,这也让语音识别成为是各大企业必争的互联网入口级技术。当前如火如荼的语音输入法等应用,以及智能音箱、智能机器人,以及智能家居等智能硬件,都是市场规模极为庞大的典型应用场景。据市场调研机构Tractica统计,2017年全球语音和语音识别软件市场规模达到11亿美元,而在2025年,这一数字预计将达到69亿美元。
因此,从行业巨头到新创公司,都在积极部署语音识别技术。而面对大量终端设备所产生的海量数据,在云端部署人工智能成为当下的主流方式。一方面,针对庞大的开发者需求,基于云服务来构建开放平台,才能够推动行业生态。另一方面,企业需要在云端部署高性能的服务器系统,才能够满足大量终端设备的语音处理请求。
作为目前全球市值最高的企业,微软在云端业务方面的高速增长,成为其发展的重要驱动力。在微软2019财年第一财季的财报中显示,Azure云业务的营收同比增长达76%。当前,微软也正将人工智能作为Azure发展的一大核心方向。微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士曾表示,“Azure是人工智能最佳的云平台,许多开发者和企业已经利用它创造出许多奇妙的应用。”
依图科技+微软联合发布依图语音开放平台
此次依图与微软深化合作,基于微软Azure云,联合推出依图语音开放平台,可以看作是在最好的人工智能云平台上,将行业领先的语音识别技术能力开放给广泛的第三方应用开发者。而在联合发布语音开放平台之后,依图与微软还将在智能语音领域展开更深层次的合作,共建AI生态。
依图与华为联合发布的“智能语音联合解决方案”,基于依图语音开放平台及华为全栈全场景昇腾(Ascend)系列芯片和面向数据中心侧的Atlas 300 AI加速卡,将双方强大的技术研发能力与生态服务能力深度结合,形成软硬件一体化的联合解决方案。借助该解决方案,第三方应用开发者可进一步提升开发效率,从业界领先的语音技术中受益。
Atlas是华为新一代智能云硬件平台,可以助力企业加速智能化进程,不仅可为AI应用带来强大的算力支持,更能提供完整的AI解决方案,真正让AI“跑在云上”。此次合作,可以透过软硬件的深度融合,加速企业对依图语音识别技术的云端部署,快速构建能够提供行业领先智能语音技术服务的基础设施。
依图科技+华为发布“智能语音联合解决方案”
语音识别是人工智能理解世界最重要的组成部分。依图预计,在未来6个月到12个月,语音识别技术的算法性能将呈指数级增长,随之带来的是对云端处理的巨大需求。此次依图与微软、华为的合作,有力推动了依图智能语音技术在云端平台的构建,形成智能语音云端联盟,为解锁新场景、赋能新应用提供坚实的基础设施,从而撬动数十亿美元的市场。
关键字:人工智能 语音识别技术 依图 华为
引用地址:
依图科技+华为发布“智能语音联合解决方案”
推荐阅读最新更新时间:2024-05-03 03:24
TCL欧洲布局忙,主攻AI领域?
从位于波兰市区的 TCL 欧洲研发中心驱车约一个小时,便可到达TCL波兰工厂。 TCL波兰工厂副总经理托马斯·奥兰德告诉记者,该厂去年 彩电 产量120万台,今年将增至200万台。“从这里发货,一天可以到达德国,两天可以到达法国,三四天可以到达西班牙、葡萄牙。” 波兰工厂是TCL向欧洲各国供应彩电产品的生产基地和仓储基地,可以直接配送到零售门店。托马斯自豪地说,过去几年,波兰工厂的产量迅速攀升,从2015年的80万台到今年冲击200万台。 背后的原因,一方面是TCL在产品创新、质量、服务上进行的优化;另一方面是中欧班列的帮助,“我们从2016开始用中欧班列,2017年、2018年100%用中欧班列,今年火车100%准时
[嵌入式]
AI是否有边界 谁来握住AI野马的缰绳
人工智能在我看来可以说是一个人类最伟大的创造,并不是说这个技术能够实现什么样的高度,而是这个技术真的解放了人类,激发出机器的生产力,让人释放出来可以做更具人性和创造性的事情。不过对于人工智能的担忧也与生俱来,人工智能会不会失控,会不会带来人类无法挽回的后果? 近日,人工智能旷视科技宣布成立治理研究院,呼吁各界对AI治理事件的关注和讨论。“人工智能技术要可持续化发展,过去几年,人工智能经历了一段野蛮生长的时期,”旷视AI治理研究院负责人称:“2020年将成为AI治理元年。” “人工智能的野蛮生长”这种说法并非没有缘由,随着互联网、云计算在各行各业的快速渗透,整个社会的网络化和数据化程度空前提升,原来越多的智能化设备开始切实
[机器人]
Conservation AI在全球濒危物种威胁检测方面取得巨大飞跃
非营利组织使用NVIDIA Jetson平台和Triton推理服务器,实时检测穿山甲、犀牛等50多个物种所面临的威胁。 图中所示的是首次使用人工智能(AI)对全球最濒危的物种之一——穿山甲进行实时检测的情形。 总部位于英国的非营利组织Conservation AI采用NVIDIA技术让实时监测成为现实。AI可以帮助实时追踪最稀有、隐蔽的物种,使动物保护者能够及时保护它们免受偷猎者、火灾等威胁。 该组织四年前由利物浦约翰摩尔大学的研究人员Paul Fergus、Carl Chalmers、Serge Wich和Steven Longmore创立。 在过去的一年半中,Conservation AI已经在全球各地部署了7
[嵌入式]
华为 Mate X2 折叠屏手机官宣或月底发布
集微网2月3日消息,今天华为终端官方微博宣布,华为 Mate X2 折叠屏手机将于 2 月 22 日发布,从官方公布的宣传海报来看,应该是采用内折叠方案。 此前曾有华为内折叠专利曝光,与三星的折叠屏方案相似,采用书本式的内折叠柔性屏方案,四周边框很窄且等宽,屏占比相当不错。而在手机背面,该机则采用了类似华为P40系列的设计思路,后置矩阵式摄像头模组。 据数码博主爆料,华为 Mate X2采用8.01英寸内折主屏,分辨率为2480×2200,外部的副屏尺寸为6.45英寸,分辨率为2700×1160,整机尺寸为161.8×145.8×8.2mm,重量为295g。 图源:微博 华为 Mate X2将搭载麒麟9000处理器,配
[手机便携]
智慧出行方案继续拓宽,余承东透露了华为哪些黑科技?
2023年的汽车市场的内卷之势,从始至终都没有停下过,而在新能源市场中,不仅卷价格,更要卷实力。 随着新能源汽车的发展,智能化也成为了新能源行业的重要领域,也正是因为智能化的全面崛起,所以导致很多新品牌伴随新时代的“势头”下,全面爆发。 11月9日晚,智选车模式升级为鸿蒙智行,2019年华为成立智能汽车解决方案BU部门,时至今日,在智能汽车智慧出行领域,华为也成为了引领行业的角色。 根据此次发布会表示,华为智慧出行不局限于某一个领域,而是在智能汽车数字平台、智能座舱、智能驾驶、以及主被动安全同步规划,并对产品质量严格管控,并且未来将持续布局三种合作模式去赋能车企,帮助车企铸造打造更全面、更安全、更智能的
[汽车电子]
苹果/华为/小米供应商龙华薄膜创业板IPO获得受理
12月30日,深交所正式受理四川龙华光电薄膜股份有限公司(简称“龙华薄膜”)的创业板IPO申请。 资料显示,龙华薄膜自成立以来,深耕PC 材料、PMMA 材料及其复合材料领域,围绕材料特性和下游需求不断创新,迭代推出不同特性、不同应用领域的高分子功能薄膜产品。在 PC 材料方面,公司在薄膜开关、标牌等印刷及阻燃产品的基础上开发出了反光基膜、超薄导光基膜、偏光片位相差膜等光学结构材料产品;在PMMA材料方面,公司持续开发出了 PMMA 材质的反光基膜、导光基膜,正在研发的偏光片 PVA 保护膜有望打破国内大尺寸偏光片高度依赖进口 TAC 膜的局面,实现进口替代。 龙华薄膜基于对PC材料、PMMA材料特性的深入了解,集合PC材料、
[手机便携]
吴恩达创建deeplearning.ai讲授AI课程普及深度学习知识
近日,前百度首席科学家吴恩达在其Twitter上发布重磅消息称,deeplearning.ai课程正式登录Cousera。此外,吴恩达还同时在Medium发布博文介绍了这套课程。下面就随网络通信小编一起来了解一下相关内容吧。 此消息意味着,从百度离职后,吴恩达所创立deeplearning.ai一直专注于 深度学习 入门课程的开发。吴恩达表示,deeplearning.ai立志于扩散 AI 知识,向全世界普及 深度学习 知识。 该套课程一共五门,组成了Cousera上的全新 深度学习 专业(specialization)。用户可通过该课程学习到深度学习的基础、理解如何创建神经网络,怎么领导机器学习项目;还会学习到卷积
[网络通信]
大模型时代,AI三巨头商汤、旷视、讯飞逐鹿智驾
2024年的智驾竞争已经处于收敛的阶段,但仍有新的巨头进入这一极度内卷的赛道。他们是商汤、旷视、科大讯飞等以算法见长的AI平台公司。 中国电动汽车百人会论坛上,小鹏汽车董事长何小鹏说,上一个十年是新能源的十年,下一个十年将是智能化的十年。 汽车智能化水平对消费者的吸引力越来越强,已经成为车企全力打造的差异化能力。面对这一趋势,车企为了保持产业的领先地位,通过自研、收购等方式构建智能化核心竞争力;以地平线等为代表的新兴公司早已深耕多年,终于迎来收获季;传统Tier1巨头同样不甘落后,加速布局智能化核心技术。 现在,又有新的力量开始崛起。这几家公司长期以来一直蛰伏一旁,但由于市场不明朗,只是保守跟随,或者做一些预研性的研究
[汽车电子]