腾讯提出共享AI,同声传译亮相惊艳全场

发布者:SerendipityRose最新更新时间:2017-11-10 来源: eefocus关键字:腾讯  AI  机器学习 手机看文章 扫描二维码
随时随地手机看文章

在昨日举办的腾讯2017全球合作伙伴大会上,腾讯AI Lab披露了AI发展布局的最新动态。本文整理了四个重磅演讲的干货内容,包括腾讯AI的发展路线图、游戏AI研究的挑战与应对、多媒体AI从图片到视频的演进,及惊艳全场的同声传译产品,以飨读者。完整文章可到官网阅读。

 

一、腾讯AI路线图:共享AI是大势所趋

 

《共享AI:让AI无处不在》

演讲人:腾讯AI Lab主任 张潼博士

 

张潼博士的演讲勾勒了AI行业未来发展的路线图:共享AI的三大关键元素:企业共享研究应用成果、行业共享发展平台,到学界共享新思路的「共享AI时代」。

 

 

「在设定AI Lab作为企业级AI实验室的愿景时,我们希望能代表腾讯打造世界级的AI能力,让科技以创新的方式去解决人类所面临的困难与挑战,未来能让AI无处不在(Make AI Everywhere)。」张博表示,腾讯的AI发展路线图,将围绕企业、行业到学界的AI共享共联展开。

 

第一是企业内外部共享研究应用成果,缩短技术迭代时间,小步快跑构建核心技术竞争力。

 

在研究上,腾讯AI Lab自成立一年来,本着「学术有影响,工业有产出」的发展目标,在计算机视觉领域的CVPR、自然语言处理领域ACL、机器学习领域的ICML和NIPS等衡量机构研究能力的多个AI顶级学术会议中,被收录论文80多篇,位居国内企业前列;此外还在人脸识别检测MegaFace Challenge2、前沿的图片描述生成数据集微软MS COCO中排名第一。

 

在应用上,除了技术已落地到微信、QQ、音乐和视频平台,还围绕游戏、内容和社交等核心业务有的放矢进行技术突破,通过技术提升用户的游戏体验,内容AI中文字、图像和视频的理解、生成与推荐,及社交AI中的终端硬件与全新交互方式等。

 

 

第二是行业共享大生态,赋能中小从业者和传统产业。

 

一方面是针对中小从业者与合作伙伴,共享AI基础能力,如通过腾讯开放平台,将算法、数据到模型等AI基础能力开放,并为从业者提供方便易用的以API和SDK为主的AI服务解决方案。

 

另一方面针对传统行业,通过对「行业AI+X」计划与AI创业者的扶植开放腾讯AI能力,推动AI在更多垂直领域台落地。比如腾讯发布的首款AI医学影像产品「腾讯觅影」,使用AI Lab技术发现早期食管癌的准确率已高达90%;而此次论坛发布的「AI生态计划」将从场景、技术、人才、资本四个方面全面扶植AI创业者,与合作伙伴共建共享AI行业生态。

 

 

第三是学界共享新思路,将工业界资源、经验反向输入到AI人才「造血库」。

 

我们宣布启动全球博士生奖学金计划,前者会授予入选博士生丰厚的奖学金,到AI Lab实地研究,接触真实需求和数据的机会,与学界联合培养AI领域的顶级人才。

 

此外每年一届的学术论坛也打造为吸引国外顶级学者到华学术研究交流的顶级平台。

 

 

二、游戏AI:赋能现实世界,

研究的奥义远不止于游戏

 

《游戏AI:虚拟世界对物理世界的赋能》

演讲人:腾讯AI Lab机器学习中心负责人 刘晗博士

 

 

我们最想强调的,是游戏AI研究的奥义——远不止于游戏本身。这是一个富有挑战而令人振奋的研究课题,研究当中累积的经验、方法与结论,能在更广大深远的范围被利用。首先是打通虚拟与现实世界的藩篱,从而赋能物理世界,比如无人车和机器人的发展;其次,游戏中对话智能的研究,或能成为通向强人工智能的重要路径;第三,研究游戏中人、智能体和环境的交互,能让智慧城市这样复杂而意义深远的项目受益。

 

游戏AI是人工智能与博弈论的一个交叉领域。从小的方面来说,游戏AI研究如何用人工智能技术来提升人类玩游戏的体验。从大的方面来说,游戏AI研究人,智能体,以及环境之间的复杂交互关系。 游戏AI驱动了人工智能的发展,从国际象棋到围棋击败人类顶尖高手,而目前所挑战的游戏已从棋盘类转向《星际争霸》Real Time Strategy(RTS)和《DOTA 2》Multi-Player Online Battle Arena (MOBA)等游戏。

 

 

游戏AI涉及到三个核心能力:对外界环境的感知,根据状态做出的决策,人与智能体之间的对话。比如在围棋的游戏场景,可以通过感知棋盘的全局表达状态决定在哪里落子。而现实中的无人车,同样可以通过视觉,激光雷达的感知对方向盘,刹车等动作做出决策。

 

 

理解了游戏AI的三个核心能力。接下来我解释研究中三个核心挑战,及腾讯的解决方案。

 

第一个挑战是游戏的状态空间过大。比如很多战略型游戏的状态空间是无穷维,远大于围棋空间。腾讯提出了一套整合了模型,算法,与计算体系结构的解决方案,叫做腾讯机器大脑,整个系统的核心是使用深度神经网络来建模超大规模的状态空间。

 

第二个挑战是许多复杂的多玩家游戏需要多个智能体协调操作,目前这方面理论比较缺乏。为设计出一个完善的多智能体AI,一个核心问题是将强化学习的价值网络与描述宏观战略的行为树进行互操作,并使其融合。

 

第三个挑战是绝大部分游戏AI是用模拟器在一个理想化的虚拟世界中开发。如何打通虚拟与现实,又是一个核心挑战。我们的解决方案结合反向强化学习及动态探索机制,对游戏AI中的参数进行贝叶斯升级。这样得到的系统能保证在现实世界花最小的成本,就能成功部署。

 

 

这一套感知、对话与决策模块,形成了一套通用系统,未来有望在现实中被应用到更多场景中,这就是我们说的虚拟对现实的赋能。

 

 

三、多媒体AI:

从图片到视频的深度内容探索

 

《多媒体AI:睁开机器之眼》

演讲人:腾讯AI Lab计算机视觉中心负责人 刘威博士

 

 

我们正在进入一个「多媒体内容消费」的时代,每个中国人每天都在消费大量的多媒体内容,也在提供大量的多媒体数据。在AI领域,多媒体AI将赋予计算机处理、识别、理解内容的综合能力。从图像到多媒体,数据维度大大提升,我们希望走出一条自主的创新之路,因此发展了三个基础AI能力:处理、识别、理解。

 

 

我们的目标是要打造最好的多媒体AI技术,通过建立一个有效的技术矩阵,涵盖产生、处理、识别、理解、分发等多种基础AI能力,应用上从视频制作到视频推荐覆盖完整的视频产业链。

 

数字化内容是腾讯的战略之一,内容AI是腾讯AI Lab四大应用方向之一,而多媒体AI则首当其冲。我们的愿景,是在全球范围内做内容AI的引领者、实践者和贡献者。

 

 

我们也取得了一些科研成果。比如在OCR(Optical Character Recognition,译为光学字符识别)任务中取得六个第一,其中三项是针对网络图片文本,另外三项是针对聚焦场景文本。我们把算法识别精度提高到了90%以上,这是巨大的升级。

 

 

第二个是视频人脸检测和识别。需要克服视频中人脸的低分辨率、姿态、遮挡、表情、妆容、光照等挑战。我们在这方面也取得了比较好的结果。

 

 

还有图像描述生成技术。我们对整个深度学习架构(包括卷积神经网、长短时记忆网、多阶段注意力)进行端对端的训练,实现图像到文本的有机过渡,得到一个很好的模型。这项技术目前在最权威的MS COCO数据集上排名第一。

 

基于这项技术,机器可在人们上传图片到QQ空间后知道图片在说什么;进行图像搜索、图像推荐和图像文本间的对话;帮助视障人群看到图像世界。

 

四、翻译AI:AI同声传译亮相惊艳全场

 

《翻译AI:重建巴别塔》

演讲人:腾讯AI Lab机器翻译平台侧负责人 杨月奎

 

 

时至今日,翻译已成为具有千亿规模的巨大市场。一方面,人工翻译价格高昂、供给不足,机器翻译的水平则在日益提升带来了更低的成本和更高的效率;另一方面,机器翻译的研究牵涉到自然语言的分析、转换与生成,可作为NLP的重要研发平台,也是人工智能的里程碑式目标。

 

 

2014年,随着神经网络机器翻译(NMT)的出现,错误率大幅下降,各互联网巨头也陆续推出了自己的机器翻译平台。可惜NMT也未提供完美的解决方案,面临众多挑战。首先是译文忠实度问题,存在译文丢失或跑飞的可能。其次是对低频词的训练难度更大,一些实体词很可能翻译不出来;最后是对训练数据的规模,也有着更高的要求。

 

针对NMT面临的这些挑战,我们也相对应地做了一些优化工作。为了提高译文忠实度,我们使用交互式的Attention模型来增强Attention机制,利用重构模型加强翻译完整性的学习,利用Rerank模型选取更优的译文;为了加强对低频词的训练,我们引入子词模型;为了提升训练效率,我们采取并行训练框架,支持多机多卡并行训练。除此之外,我们也加入了深层网络、残差网络和模型融合等技术。

 

目前我们已支持中文、英语、粤语、日语、韩语、法语、德语、西班牙、越南语等多种语言。

 

 

有了这样的机器翻译技术,我们也在公司内外积极谋求应用落地,包括结合语音识别技术的同声传译、结合图像识别技术的拍照翻译、结合人机交互能力的辅助翻译等。一方面应用于公司内部的微信、手机QQ和微云等产品,另一方面开放能力,赋能更多合作伙伴。

 

 

这些能力我们都已经在腾讯开放平台(AI.QQ.COM)上推出了,而在出境游、商务会议、跨国交流等场景上我们期待能有更广泛应用。


关键字:腾讯  AI  机器学习 引用地址:腾讯提出共享AI,同声传译亮相惊艳全场

上一篇:中国准独角兽公司工资单,AI公司工资让人羡慕
下一篇:云成为了新常态,但你知道云测试吗?

推荐阅读最新更新时间:2024-05-03 01:56

韩计划至2030年开发多达50种AI芯片
据韩联社报道,韩国科学和信息通信技术部12日表示,韩国计划到2030年开发多达50种以人工智能为核心的系统半导体。目前韩国正力争在存储芯片之外的半导体领域占据领导地位。 今年早些时候,韩国在下一代芯片的开发上掷下大赌注,计划到2029年投入约1万亿韩元(合8.71亿美元)。 韩国科学和信息通信技术部表示,它计划在2022年之前通过本土自主技术来开发此类芯片,同时在未来10年内培养3000名该领域的专家。
[手机便携]
NVIDIA AI Enterprise 助力研究人员、医院攻克癌症
荷兰癌症研究所、医疗公司 Vyasa 和 iCAD 是率先使用 NVIDIA 软件套件快速跟踪端到端 AI 工作负载的公司。 图注:NVIDIA AI Enterprise使医院的IT管理员能够在医院的核心应用程序旁上运行AI应用程序,例如用于乳腺检查的iCAD Profound AI软件。 无论是推进癌症筛查、减少假阳性,还是改进肿瘤识别和治疗方案,AI 都是医疗健康创新和加速的强大推动力。 然而,尽管前景光明,但将 AI 集成到实际解决方案中却可能会给许多 IT 组织带来挑战。 荷兰癌症研究所 (NKI) 是先进的癌症研究和治疗中心,它正在使用 NVIDIA AI Enterprise 软件套件在比目前常用
[医疗电子]
NVIDIA <font color='red'>AI</font> Enterprise 助力研究人员、医院攻克癌症
Strategy Analytics:2018年创造很酷用户体验的十大趋势
2017年是 机器学习 , 人工智能 和另类人机界面的一年,极大地影响了众多设备的用户体验。 但2018年的主要创新将是什么呢?  Strategy Analytics 用户体验创新研究(UXIP)发布的最新洞察报告《2018年创造很酷用户体验的十大趋势》提供了技术创新将如何在新的一年最大程度的影响用户体验的十大预测 。   报告的关键发现:   ·车载智能手机镜像、流媒体、嵌入式导航和HMI设计将会相互交汇。 ·放置在智能手机屏幕下方的指纹扫描仪将会出现。 ·针对主流大众的更具吸引力内容的解决方案将重振高端VR市场。 ·会话用户界面 - 包括聊天机器人 - 将在2018年大量出现,并带来更引人入胜的用户体验。   Strateg
[嵌入式]
百度谷歌先后发布定制化图像平台 人工智能大众化的第一步?
继百度去年11月宣布推出定制化图像开放平台之后不久,北京时间1月18日凌晨,谷歌宣布推谷歌Cloud AutoML云开放平台,并发布AutoML Vision,即用于建立机器视觉模型的工具,用户可利用该工具自动生成定制化的图像模型,不论是工程师还是技术“小白”。 值得关注的是,这两家人工智能领域的巨头公司,都不谋而合地率先开放了图像定制平台或工具。用户通过简单的界面,上传定制训练数据,进行少量标注,系统就可自动生成特定图像识别的AI模型,从而惠及更多的开发者,促进AI技术的推广使用。而这或许也意味着人工智能机器视觉技术的发展,已经进入了一个全新的阶段。 机器视觉一直以来被认为是人工智能的关键基础能力,图像识别则是机器视觉的核心研
[机器人]
MRAM:释放边缘计算无限潜能
边缘计算在工业物联网、机器人、可穿戴设备、人工智能、汽车和便携式设计等领域的应用正在不断增长。伴随着这种增长的是对高速、低延迟、非易失性、低功耗、低成本内存的需求,这些内存用于程序存储和数据备份。虽然有许多可用方案,包括SRAM、DRAM、闪存和电可擦可编程只读存储器(EEPROM),但这些技术都需要在一个或多个领域进行权衡,但对于边缘计算来说,他们似乎不太适合。 相反,设计者可以转向磁阻随机存取存储器(MRAM)。顾名思义,MRAM设备将数据存储在磁存储元素中,提供真正的随机访问,并允许在内存中随机读写。此外,它们的结构和操作具有低延迟、低泄漏、高写入周期数和高保持率的特点,这些都是边缘计算非常需要的。 本文将对常见内存
[嵌入式]
MRAM:释放边缘计算无限潜能
人工智能前景“显山露水” 安防成产业热点
继7月份国务院印发《新一代人工智能发展规划》之后,人工智能产业再迎政策利好。据国家发改委网站消息,为贯彻落实“十三五”规划《纲要》,2018年,国家发展改革委将组织实施“互联网+”、人工智能创新发展和数字经济试点重大工程。   1956年,达特茅斯会议召开,人工智能作为一项新兴课题,正式登上世界科研的舞台。2016年,AlphaGo程序轻取围棋世界冠军李世石,引起了全世界的关注。这一里程碑事件,标志着人工智能技术正在成为改变人类经济、社会的新技术引擎。随着国务院印发《新一代人工智能发展规划》,人工智能已经成为国内最热门的前沿技术。   安防行业作为人工智能最早具有市场空间的行业,对人工智能
[安防电子]
中国对AI设备拥抱度全球最高 52%消费者计划购买
人工智能在消费者包装商品(CPG)和零售行业迅速发展。如今,越来越多的消费者开始使用所谓的“语音服务”进行家居用品和杂货的购买。 人工智能也帮助商店在实时库存和货架管理等方面实现了大幅度的优化提升。 家庭式设备越来越偏向语音化 普华永道近期发布的《2018年全球消费者洞察》(2018 Global Consumer Insights Survey)面向全球27个国家的2.2万多名消费者进行了调研。 约只有10%的受访者表示,他们拥有AI设备,包括机器人、自动化个人助手、智能音箱等;近32%的受访者表示,他们计划购买这类人工智能设备。 在未来的3-5年内,这些领域会见证更蓬勃的发展,并且赋予这些AI消费设备更多功能。 语音商务
[机器人]
医疗领域成为人工智能未来发展突破口
  经济之声评论员蔡军点评:人工智能未来发展依赖市场推动,人力成本最高的医疗领域成为突破口。 蔡军:   去年(2011年),人工智能发展引爆了大众关注。其中最著名的例子就是苹果手机上个人的“智能个人语音助理”Siri,Siri能够理解人类语言的模糊性。有很强的人工智能。它可以大部分“理解”人说的话。   比如用户说,到了超市记得提醒买牙膏。Siri会接着说:你想让我什么时候提醒你?客户只要说:“今天接下来还有什么事?”,Siri会明白这是指今天的日程表,替你列出来。客户说,我喝醉了。Siri回答:我发现你附近有些出租车。如果说:车胎没气儿了;Siri会说:我找到了14家拖车服务,其中12家在你附近。这和人们科幻电影中
[医疗电子]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved