「最大人工智能公司」阿里AI全景图首次全曝光
▲点击上方 雷锋网 关注
产业AI、平台普惠与强云AI,阿里的AI全景图就这么大张旗鼓的公开了。
文 | 张帅
雷锋网云栖大会现场报道,第二天的飞天智能主论坛上,阿里以集中化的方式呈现了自己的AI全貌。阿里的科学家和工程师轮番上台,这是信息量爆棚的一个主论坛,同时这也是一篇信息量爆棚的文章。温馨提示,浓缩精华版请拉到本文最后看总结。
十人组成阿里云飞天智能“最强天团”,包括:
阿里云智能副总裁、产品与解决方案管理部总经理马劲;
阿里巴巴副总裁、达摩院人工智能中心负责人、高级研究员华先胜;
阿里巴巴达摩院研究员、语音实验室负责人鄢志杰;
阿里巴巴达摩院研究员、自动驾驶实验室负责人王刚 ;
阿里云智能副总裁、数据智能事业部总经理、研究员曾震宇 ;
阿里巴巴副总裁、阿里云智能计算平台事业部总经理、高级研究员贾扬清;
阿里云智能产品管理部总经理、AIoT事业部产品与解决方案总经理何云飞;
阿里巴巴集团副总裁、平头哥半导体公司总经理戚肖宁;
阿里巴巴副总裁、阿里云智能数据库产品事业部总经理、高级研究员李飞飞;
阿里巴巴合伙人、阿里云智能基础产品事业部总经理、研究员蒋江伟。
如上即是阿里巴巴公布的AI全景,以下为分层阐述。
“Hello,world”,马劲以程序员问候开场,他讲到,今年年初阿里云做了一次重要的升级,升级之后的云智能能带来什么,是行业整体都在关注的话题。以往各家云厂商或多或少都阐述过云+AI,阿里云又将如何将其全盘托出。
负责产品的马劲也是今天的主持人,阿里的AI能力最终都要以产品形式做输出,由他来串起阿里AI全景图最合适不过。
马劲表示,产业实践是检验AI价值的唯一标准,2017年的云栖大会,阿里云提出了AI要在产业实践中要发挥作用。“因为只有产业里面给我们提出明确的需求,有明确的需求AI才有改进的方向,同样产业里面有真实的数据,可以建立更好的模型,还有很重要的一点,云计算可以提供更强的计算能力,同时不断的降低计算的成本。在这个当中,我们的算法、算力、数据三者在不断的结合,慢慢的在一个一个的产业实践当中,一点一点带来价值。”
阿里的产业AI实践包括搜索、设计、客服如阿里小蜜、公共服务如城市大脑、物流、语音终端、翻译等。据介绍,阿里巴巴AI每天调用超过1万亿次,其中日处理图像10亿张,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,已经成为中国最大的人工智能公司。
阿里巴巴5万多位工程师,涉及的领域上天入地,今天集中讲人工智能还是让人稍感意外。这也是第一次,阿里官方出品,系统性、完整地介绍阿里巴巴经济体真实场景与AI技术栈的良性循环,把产业AI、各种算法、AI计算平台、基础设施、芯片等各个层面予以全貌展现、分层解刨。
基础层,提供边缘计算、专有云、公共云、终端、芯片等;
平台层,主要给开发者使用,包括飞天AI平台、飞天大数据平台、飞天AIoT平台等;
AI服务层和产业应用层,算法训练之后变成原子化的服务,可以直接应用在现实场景中。
如上三层你可以抽象的理解为阿里云的IaaS、PaaS和SaaS,虽然划分内涵稍有不同,但都是AI所必需的的三个层级。
在大会现场,阿里按照从上层到下层的顺序来讲述,产业AI是阿里AI全景图的第一部分,这部分集中展示了阿里将AI应用于产业的实践。在雷锋网看来,这也是重落地轻概念的表现,技术落地才有价值,就像阿里云智能总裁张建锋所言,「需求牵引、技术驱动」。
华先胜:视觉智能,规模实战
人工智能在实验室和实际场景的表现差之千里,即使是人工智能中最璀璨最亮眼的视觉智能也是如此,华先胜指出,目前视觉智能的三大问题在于算不准、算不快、不能产生核心价值。
在阿里巴巴内部,视觉智能的日调用量超过1600亿次,华先胜介绍了规模化实战的三秘诀:
深研算法:以高精准分割为例,阿里提出的高精密三维分析让图片精读准确且不失真,把语义的分类引入分割,把分割进行分层,由粗到细逐步的优化,加上很多前处理、后处理的方法才可以做到高精度。
深挖效率:以城市大脑项目为例,最初一台服务器只能处理一路视频,后来增加到十路视频处理,应用FPGA可以提升到30路,但越往上越难以优化,这限制了城市大脑的批量推广。
后来提出了一种通用的端到端的量化的方法,用华先胜的话说,“简单到只要在参数方面加到一个函数,通过迭代就能够逼近普通的量化,而且它是端到端支持任意比特的量化”。
通过这种方法,阿里把视频处理能力从30路提升到了70路,相当于过去700台服务器的任务,现在只需要10台机器一个机柜就可以,城市大脑的快速复制也变得更加容易。
再比如超大规模搜索,从十亿级别数据规模,毫秒级别检索有损,到阿里目前支持的千亿级规模索引,毫秒级近无损检索,同时采用GPU量化,可以提速6倍。
深挖产业:阿里直接用产业实践来描述。
以较为成熟的城市交通场景为例,通行效率和交通安全是城市交通的核心。通行效率方面,精准的视觉感知技术,对流量做精准的感知,同时用深度学习的图像感知技术对图像做精准的预测,可以帮助交警解决难题。
交通安全方面,通过视觉感知对交通的事故进行实时全量的感知,能够快速的处理交通事故,但这不是全部,阿里云更进一步,能够预估事故发生的概率,如果有些地段事故发生的概率会增加,可以做到提前进行管控、处理,减少这些事情的发生,创造新价值。
在演讲的最后,华先胜表示,“不成功的例子往往有不同的原因,而成功的规模化实战却有很强的共性。我们用强大的AI算法和算力、数据、价值以及第五个关键词产业,让人工智能、视觉智能落到实处必须深入产业,我们在产业当中深研算法,深挖效率,让视觉智能成为产业,为产业创造不可替代的价值,我们让视觉智能认知现实,看清未来!”
鄢志杰:达摩院重构沟通之桥,阿里巴巴语言&语音AI
阿里巴巴语言&语音AI背靠达摩院,在语音识别方面,2018年6月,阿里自主开发的语音识别模型(DFSMN)在世界最大的免费语音识别数据库LibriSpeech上进行公开测试,将全球语音识别准确率纪录提高至96.04%。
在语音合成方面,自主研发的Knowledge-Aware Neural TTS (KAN-TTS)语音合作技术,将特定发音人数据的自然度能提高到97%以上,有望通过图灵测试。在语音交互上,研发ESIM模型,在DSTC-7对话系统挑战赛获两个冠军;阿里语音助手被《麻省理工科技评论》选为2018十大科技进展。
语言技术方面,阿里在2018年在国际公认的顶级机器翻译赛事WMT(Workshop on Machine Translation)上获得5项冠军......
阿里的AI不再是只在阿里内部使用,在本次大会上,鄢志杰也表示,达摩院前沿技术零时差上云,阿里巴巴内部应用的语言和语音AI技术都可以在阿里云上在线获得。
传统行业并不是不想拥抱先进的AI,而实际情况是——传统技术提供商提供的能力往往达不到行业利用的最低门槛,必须要做定制才可以用,定制就意味着额外的成本和时间,数据安全也是另一个障碍。
“整个语音AI落地过程当中,最尖锐的矛盾就是算法专家驻场定制化需求,跟这类专家的本身的人数稀少跟成本过高的矛盾”,鄢志杰表示。
对此,阿里前不久提出了自学习定制优化产品,形象地描述就是——任何行业里面的实践者,可以基于自学习定制平台,在一个安全环境内,输入自己的行业数据,在完全不知道语音跟语言算法的情况下,为垂直领域提供最优的语音跟语言的技术指标。
“我们把传统的属于少数语音技术提供商的技术,交还到了行业里面实践者的手里。让他们可以握住这个方向盘,决定这些AI技术在他的行业落地的方向,达摩院的AI就是大家的AI。”
王刚:阿里巴巴自动驾驶之路
阿里巴巴自动驾驶的使命是让物流更便捷高效,阿里自动驾驶专注两个物流场景,其一是末端物流场景,园区无人车完成物流寄取件,其二是公开道路城配,这是定位未来的场景。
自动驾驶为什么难,业界有不同的答案,阿里云认为是场景多样,道路复杂。对此,王刚重温了自动驾驶的“No Free Lunch原则”,“没有免费的午餐”,含义是通用算法不适用,要针对各场景细分优化,这就意味着额外的投入。
通用的场景库花费以人工设计、比较粗粒度、静态场景为主,而阿里巴巴的场景库则不同,按照数据驱动、高度精细化、和动态行为分类,特点是和算法高度融合,比如一个切入场景就可以被分为25个算法场景。
场景众多,每个场景再细分,算法乘数级增长,怎么高效处理细化场景,阿里提出了AutoDrive平台。相比通用的人工加智能方法,领域专家要负责超参数、网络架构、决策工程、数据规则等等一系列工作,阿里巴巴是用计算换智能。
AutoDrive平台能够基于工程架构、设计理念自动化搜索和学习算法。据介绍,AutoDrive能够路口防撞策略相比人工设计提升16.5%,研发效率提高五倍,检测模型大小减少90%延迟降低50%。
曾震宇:产业AI,让各行各业拥有智慧的“大脑”
“过去五年,AI支撑起阿里巴巴,未来五年,AI将支撑起各行各业。城市大脑、工业大脑这是我们在产业AI里面的实践。”曾震宇表示。
三年前,城市大脑在杭州落地,阿里以交通拥堵问题切入,阿里希望能够把城市数据当成一种资源来看待,打破应用信息化壁垒的关键,把数据进行融合,用AI和数据来支撑交通,这就好比给城市装了智慧的大脑。
随后城市大脑的能力不断拓展,城市当中有许多的领域跟交通非常相似,一方面由于资源不足或者效率低下,另一方面有大量高价值的数据处于沉睡状态,阿里用解决交通问题类似的方式来解决这些问题,通过城市大脑把城市的数据进行汇聚和融合,把数据转化为推动城市发展的资源。
城市大脑是构建在阿里云飞天操作系统之上,它能够提供城市级的数据中台,数据中台类似一个城市强大的地基,它能够帮助政府把各行各业的数据进行汇聚、融合,并且能够提供强大的计算能力,能够把城市的数据转化为城市发展的新的能源。正因为城市大脑能够把各行各业的多元数据进行融合,打破了壁垒,并且通过AI技术才可以做到自动决策和全局的协同。
产业AI主要讲各个行业的落地情况,而怎么能让更多人以工程化方法融入到AI产业之中,AI不仅仅要做到能用,更要求好用,冰山之下的人工智能计算等平台很厚很重,但也很重要。
贾扬清:让AI 拥有无限可能的开发平台
大神贾扬清的语速稍稍放慢,今天主要讲AI工程化的平台实践。
很多人都有疑问,为什么会有非常多的业务在一个统一平台上呢?为什么不能直接一个平台一个业务呢?阿里所想到的是,平台能够向应用所提供的是它的资源,它的技术,它统一的方法论输出,能统一的抬升业务的水平,并且业务的经验不断沉淀在平台之上,提升平台的能力,使得阿里面向用户的时候,能自信的提供这些平台的能力。
作为TensorFlow和caffe的主要作者,贾扬清经常被问到一个问题,“阿里要不要做自己的深度学习模型?”贾扬清在现场表示,“我想这个问题想了很长时间,今天我的回答:是,也不是”。
“我们不重新做轮子。几年前深度学习引擎更多的是在做最简单的建模。今天云边端一体的应用导向开发,新场景需要更多的引擎,比如端上的推理、稀疏的建模,让数字科学家更加容易的构建机器学习的流程,这让我们构建更多的、更新的、更不一样的深度学习和传统的机器学习引擎”,贾扬清给出了详实的解释,阿里不需要为了创新而创新,而是在现有的深度学习引擎之上做文章。
从数据的源头开始做清洗做建模,最后输入到AI系统里面去,离不开成熟的大数据平台。
阿里巴巴的大数据平台发展分为三阶段,2017年以前,完成了数据的统一,从找不到数据管不住数据到用得上数据,把数据都放在同一个平台上。
2018年,在找得到数据、用得到数据的时候,阿里开始思考怎么样用得好数据。不光做数据的分析,还需要在数据当中提炼出规律,提炼出决策,提炼出服务,开始逐渐建设一个多生态的平台。
今天,阿里巴巴新的飞天大数据平台正式推出,“数据从哪里来,数据到哪里去,从数据源头的同步集成,到原数据的管理,到任务的调度,到敏捷的开发,这一系列的综合治理的问题,安全分享、监控、质量,大数据平台沉淀下来的业务能力。它能够保证AI平台跟大数据平台高效无缝的处理多态数据,选择更加智能的模型。”
何云飞:AIoT 加速企业构建数字世界
“未来二十年企业所需要的80%的信息,都会来自于智能设备物理世界的感知和认知,未来80%的企业,都需要有一个自己的AIoT的平台。”何云飞肯定地表示。
在这个过程中,阿里云扮演的角色是,做好面向智联网的操作系统以及云端的基础设施,物联网操作系统最近话题很热,其实阿里巴巴在三年前就开始布局智能化的操作系统,2017年10月份发布了面向物联网的第一个版本。
AliOS Things 3.0正式发布,具备AI集成、微服务架构、安全可靠、自主可控、丰富的工具集等特性,特别是在硬件驱动层集成了最新的平头哥AI芯片架构。
面对开发者,阿里还开发了开发、测试、远程运维和远程智能设备故障定位整套开发工具,让开发者可以非常快速的将系统移植到AliOS Things 3.0。
在此基础上,阿里构建出一个城市物联网平台——城市AIoT平台2.0,把城市目前所有感知的设备接入这个平台,同时把城市里面常见的事件通过数字孪生和事件工厂能够抽象成API,让所有的合作伙伴和开发者直接在平台快速构建一个智慧城市。
戚肖宁:端云相融 普惠AI
“在AI时代三件重要的事情,算法、大数据、算力。其实没有算力其他都是空中楼阁。”戚肖宁表示。
阿里的芯片布局包括,深度优化视觉类应用定制芯片含光800,AIoT芯片基础设施玄铁嵌入式CPU系列,低门槛高效率设计芯片无剑SoC平台等等,目标是端云融合的芯片布局。
根据雷锋网此前报道,今年7月的阿里云上海峰会上,发布了高性能RISC-V架构处理器玄铁910。玄铁910集成16个核心,主频2.5GHz,采用12级乱序流水线,最大支持8MB二级缓存,搭载AI增强的向量计算引擎,可用在人工智能加速器、网络通信和自动驾驶等领域。现场公布的数据显示,玄铁910较业界主流芯片性能提高40%,较标准指令性能高出20%。
8月,平头哥又发布SoC芯片平台“无剑”,无剑平台由SoC架构、处理器、各类IP、操作系统、软件驱动和开发工具等模块构成,面向AIoT提供的集芯片架构、基础软件、算法与开发工具于一体的整体解决方案。根据官方的说法,无剑能够帮助芯片设计企业将设计成本降低50%,设计周期压缩50%。
7月发布的玄铁910是基础单元处理器IP,无剑是芯片设计平台,含光800是阿里的首款AI芯片。这也意味着,阿里的C-Sky系列、玄铁系列AIoT终端芯片IP,一站式芯片设计平台无剑,以及最新发布的云端AI芯片构建了阿里端云一体的芯片生态,平头哥端云一体全栈芯片产品家族雏形已现。
面向未来,阿里还计划投入存内计算、类脑芯片和AI辅助编解码等领域。
李飞飞:下一代企业级应用数据库系统
阿里云数据库在国内首创了云原生数据库系统,从2009开始,ECS、OSS、RDS,再到后来的VPC网络,打造了极致弹性的云原生数据库系统基础,借助开源生态,结合阿里巴巴的业务实践,打造智能化安全的云原生数据库系统,阿里云原生数据库POLARDB因此而诞生。
POLARDB采用分布式共享存储,提供高可用极致的弹性,李飞飞表示,下一代企业级数据库应用,一定是将云原生的技术以及传统的分布式数据库技术完美的结合起来。
云原生技术提供极致的弹性以及高可用,上层的分布式架构为企业级应用提供无限的水平拓展能力,这样将弹性和无限水平拓展完结合起来。
今天阿里云发布了POLARDB云原生数据库一体机,目标是“将云原生数据库搬回家”,由于行业合规以及数据安全等等一系列的问题,企业不一定能够及时的将所有的数据搬上公有云,这也是权衡之下的折中方案。利用云原生的管控技术,让客户能够在自己的机房就能使用云原生云技术的便利。
POLARDB一体机针对5G和IOT做了大量的性能优化,性能提升10倍以上,利用最新的并行查询技术,相比最新版的Mysql性能有27倍提升以上。
蒋江伟:释放云上的数据智能原力
蒋江伟上场就发布了第六代ECS实例,计算性能提升20%,内存延迟降低30%,云盘延迟降低30%;计算平稳性6个9,用户体感宕机率比物理机降低80%,适用于各种各样的计算场景,包括大数据、离线等场景。
第六代ECS背后是神龙架构,蒋江伟将其形容为计算类产品的技术中台。今天第三代神龙架构正式发布,核心是两个方面,自研虚拟化操作系统神龙Hypervisor(硬件加速虚拟化),以及自研神龙IO加速芯片,神龙架构统一了整个阿里云的计算平台,提供一致的服务能力。
蒋江伟在现场表示,过去容器最佳载体被认为是物理服务器,今天他表示,容器最佳的载体是基于神龙架构的裸金属服务器。
“为什么这么讲?物理服务器其实有四个缺陷,第一个没有弹性,第二个不够稳定,第三不是服务化的,重要的一点,迭代速度慢。而裸金属服务器既有物理机的性能,同时又有虚拟机的灵活性,虚拟化采用硬件隔离的方式,使得安全性提高,并且将存储、网络IO的运算封装在芯片,实现端到端的安全”,蒋江伟如此阐述。
阿里在人工智能赛道的起步不算最早,但可以说是踩着人工智能产业的鼓点起舞。
七年前,阿里开始筹备iDST,等到AI风口在2015年前后兴起,阿里已经储备了相当分量的AI人才;2017年阿里组建达摩院,全面启动人工智能全领域布局;目前,阿里AI在国际顶级技术赛事上获得了40多项世界第一,入选了近400篇国际顶会论文,并落地到各行各业。
上图是更简单直白的图像化描述,这几乎是阿里AI的全貌图。「需求牵引、技术驱动」,在这种思想指导下,阿里道出了建立在云计算基础之上的人工智能全局。
自然语言处理、智能语音、视觉计算落地于产业,赋能产业AI;
AI平台层,飞天AI平台、飞天大数据平台、AIoT平台居中,降低AI开发门槛,提供不同的关键能力,也起到承上启下的作用;
AI芯片层、AI云服务层打造健壮的基础设施,强云才能生长强AI。
总而言之,上层应用是呈现,平台是支撑,底层是硬核芯片和计算能力。
而阿里也确定了与众不同的AI商业化模式:从算法、应用到商业化的科研闭环;不做SaaS,而是被集成战略;通过阿里云生态输出产业AI能力。
阿里云智能,中国最大的云计算公司摇身一变,成为最大的人工智能公司,更重要的是,其一,阿里云智能要升级成为一个全新的基础设施,而不再只是最初的算力,其二,阿里云智能变成阿里集团战略一部分,定位是阿里巴巴经济体技术输出新平台。
上新!「AI投研邦」现已上线CCF GAIR 2019峰会完整视频与各大主题专场白皮书, 包括机器人前沿专场、智能交通专场、智慧城市专场、AI芯片专场、AI金融专场、AI医疗专场、智慧教育专场等。「AI投研邦」会员们可免费观看全年峰会视频与研报内容,扫码进入会员页面了解更多,或私信助教小慕(微信:moocmm)咨询。