一份报告引起的轰动,说中国人执人工智能AI牛耳咱有证据

发布者:Amybaby最新更新时间:2016-10-19 来源: eefocus关键字:AI  深度学习  人工智能 手机看文章 扫描二维码
随时随地手机看文章
本文是创新工场AI工程院副院长王咏刚做得深度的文章数据分析,缘由就是即将卸任的奥巴马总统总想搞个大事情,上周三美国白宫科技政策办公室公布全世界在人工智能AI领域的研究数据,惊呼中国已领先世界,奥巴马也接受《连线》杂志的专访谈美国在AI的战略与未来走向。对此,王咏刚做了一个数据分心来比较客观、系统的帮我们论证一下,AI领域,中国人/华人有多牛?美国白宫报告按国家统计得出中国领先世界的结论是否科学、合理?

 

人工智能这把火已经烧到了国家战略层面,连美国总统和政府机构也卷了进来。上周四,奥巴马主持白宫前沿峰会,展望美国在未来50年的发展。峰会中,白宫发布报告《国家人工智能研究与发展策略规划》(见原文链接)。相关情况,大家可以参考《连线》杂志的总统专访(Wired: Barack Obama on Artificial Intelligence, Autonomous Cars, and the Future of Humanity) 。


这两天,自媒体没少炒作这个报告;我自己呢,倒是特别地对这个报告中的两张趋势图感兴趣。报告中说,从2013年到2015年,SCI收录的论文里,提到“深度学习”的文章增长了约六倍,同时强调,“按文章数计算,美国已不再是世界第一了。”


美国不是世界第一?谁是世界第一呢?来看报告中的两张趋势图:

 


上图是每年SCI收录的文章里,提到“深度学习”或“深度神经网络”的文章数量变化趋势,同时按国家做了区分。数据本身是从Web of Science核心数据库里查询得到的。

 

 

第二张图和第一张图其他条件一样,只是增加了一个“文章必须至少被引用一次”的附加条件。也就是说,第二张图统计的文章数,是被引用过的“有效文章数”,相对来说更合理一些。


两张图里,中国都在2014年和2015年超过了美国(以及其他所有第二梯队的国家),居于领跑者的位置。


问题来了,在AI研究领域,中国人真有这么强吗?

 

从这些年的直觉看,中国人/华人在人工智能领域里的大牛比比皆是,吴恩达、孙剑、杨强、黄广斌、马毅、张大鹏 ……随口可以说出一大串,我自己在Google的研究团队,微软研究院等地亲眼看到的,也到处是中国人、华人的面孔。但这只是直观感受。整体来看,中国人/华人所做的科研贡献到底有多重要,对人工智能的推动作用到底有多大?白宫报告里的统计是不是科学、合理?


其实,对美国国家战略规划里的统计,我自己是有几个疑问的,主要包括:

 


直接搜索关键字“深度学习”、“深度神经网络”,真的能涵盖这些年人工智能领域的所有科学研究进展?像机器人、智能控制、机器视觉、无人驾驶等领域里,没有提及深度学习的文章眼见还有不少。严格按关键词匹配会漏掉多少相关文章?是否影响统计结果?


“文章至少被引用一次”,比较科学,但好像还远远不够。这种统计,真的不需要考虑SCI的影响因子吗?不考虑的话,会混进多少较差期刊上发表的比较水的论文?这些数据会不会被国内研究机构靠SCI引用数来评职称的风气污染?


在全球化时代,按国家统计,会不会有明显偏差?白宫报告没有提到被统计的文章是如何归入不同国家的。如果按作者发表文章时的所在机构,那大量在国外机构访问的中国学者会不会被算成外国人?中国人和外国人合写的文章该如何统计?如果按期刊所属国家和地区,那不同国家间的期刊水平(影响因子)差异是不是会让统计结果带有偏见?


基于此,我也想自己去做个统计。


统计前,给自己设了几条原则:


从期刊的影响因子出发,只统计影响因子高的顶尖期刊。


从Web of Science主题词出发,涵盖人工智能相关的所有科研领域,而不仅是深度学习方面的文章。


关注对象是华人,而不是用国家分类的办法去比较中国和外国——这个是我自己的选择,因为今天的学术界,国家间的合作和交流已不可忽视。类似吴恩达这样的外籍华人,其实也在为中国的人工智能发展做贡献。与其限定国家,不如从整体上看一看,地球上的华人科学家、研究者群体,到底有多厉害。


关注时间范围是2006到2016年,跨度10年左右——因为许多人说,这一波人工智能大潮是从2006后的几年时间里,才开始真正兴起的。

 


我的统计结果


先说说我的统计结果,一会儿会在附录一中讲讲我用的统计方法。


来看下2006到2016年间华人作者的平均贡献:

 

 

在2006到2016年的时间段里,近两万篇最顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。近十年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。统计角度,这已经是超出平均水平的科研贡献了。


但平均数并不能看出华人科学家、研究者在最近几年的发力程度。来看2006到2015年间,华人贡献的文章数和被引用数的变化趋势:

 

 

2006到2015年间,华人作者参与的顶级AI论文,占全部顶级AI论文数量的比例,从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数,占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%(2016 年数据较少,未用于趋势比较)。


也就是说,即便只统计顶级出版物里的顶级文章,中国人/华人在人工智能领域的贡献,在发展趋势上也和白宫报告中揭示的规律如出一辙——无论从哪个角度来说,中国人/华人正在人工智能领域里发挥举足轻重的作用,而且,从2014年,2015年开始,中国人/华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!

 

 


个案分析

会有人觉得这个统计很不可思议吗?这个结果会出乎很多人意料吗?我们还可以拿一个更具体的例子,来深入分析一下。


在顶级人工智能期刊和会议录里,我来举个大名鼎鼎的例子吧:IEEE模式分析与机器智能汇刊(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI),2015年影响因子6.077,高到没朋友,想往这里投稿的同学可能都知道被接受和发表的难度有多恐怖。


我从《IEEE模式分析与机器智能汇刊》里按引用数选出2006到2016年间的前500篇论文,下面是这500篇论文的引用数分布情况:

 

 

其实很恐怖的,前500篇文章最高引用数2715,最低引用数41——真顶级期刊!普通期刊难以望其项背呀。


那么,这500篇最顶级的人工智能论文里,华人科学家、研究者的贡献如何呢?先说几个数字:500篇顶级文章的作者一共1220人,其中华人科学家、研究者316人,占25.9%。所有作者单独累加计算的被引用数总和是231361次,其中,华人科学家、研究者被引用数总和是63846 次,占27.6%。如果单看2014年(当年华人的文章数、引用数均较高)的数据,华人科学家、研究者被引用数占51.8%,超过了半数。

 

 

如果只看《IEEE模式分析与机器智能汇刊》在2006到2016年间,引用数最多的10位华人作者和10位非华人作者的具体情况,也是一个很有趣的表格:

 

 

《IEEE模式分析与机器智能汇刊》的华人前10位大牛,与非华人前10位大牛,在每个人的总引用数上几乎不相上下。的确,最顶尖的人工智能科学家里,中国人/华人的贡献丝毫不亚于其他科学家。

 

另外,如果对人工智能特别是模式识别的研究领域不熟悉,那么,记住表中这20位顶尖科学家的名字吧。有兴趣的话,大家可以去搜一搜他们的简历,看看他们都在哪里工作,在哪里做研究,他们的学生、同事都是谁,相信会有很多发现。

 

 


原因?


为什么中国人/华人在人工智能领域这么强?因为数学好?因为兴趣使然?因为思维习惯?因为勤奋?因为教育?大家可能都有自己的答案。


本文不想展开讨论,列举数据和事实,才是本文的目的。


附录一:统计方法介绍


简单介绍一下我是怎么得到上面那些比例和趋势数据的。


周末,我先去Web of Science数据库里,找到Computer Science / Artificial Intelligence的主题类目,根据2015年SCI影响因子从高到低排序,取前50个出版物(包括期刊和会议录),这50个人工智能领域顶级期刊和会议录的详细列表见附录二。


然后,对每份顶级期刊和会议录,基于文章的被引用数对2006到2016年的所有文章进行排序。这个时间段里,期刊和会议录的平均发表文章数在500左右,我以500为上界,取每份期刊和会议录中,被引用数最多的文章,至多500篇。由此得到2006到2016年间的顶级人工智能相关论文共计19855篇。

接下来,基于这些文章的作者列表和被引用数目,统计华人科学家、研究者与全部文章作者之间的比例和趋势关系。


如何识别华人作者?好像没有特别好的方法。我的方法是根据英文姓名判断,如果英文姓名主要由汉语拼音、韦氏拼音或粤语拼音组成(当然还要考虑姓氏、名字二者在英文表述上的区别,以及其他一些经验规则),那么就假定这个作者是华裔。根据小样本集验证,这个判别方法的检准率大约在96%以上,检全率大约在90%左右。也就是说,会有一定数量的遗漏,也会有少量误识,但基本可以反映整体情况与趋势。


如何解决合作者问题?我是分别统计,并且不加权重的。第一作者和其他作者共享文章计数和引用计数。为第一作者增加权重是否影响整体统计结果?也许,但不会影响总体趋势数据,因为并没有证据表明,华人更多地出任第一作者,还是非华人更多地出任第一作者。至于每个作者的文章数和引用计数,是采用简单累加,还是采用比例累加(如两人合作,每人的贡献算0.5还是1),我做了全数据集的对比试验,几乎完全不影响整体结果。

关键字:AI  深度学习  人工智能 引用地址:一份报告引起的轰动,说中国人执人工智能AI牛耳咱有证据

上一篇:6个月24次无人机威胁事件,英国民航终于忍不了
下一篇:5800名银行员工欲被机器人取代,为啥老百姓却不买账?

推荐阅读最新更新时间:2024-05-03 00:45

盘点国外人工智能结合医疗的创业公司
   近年来,人工智能在技术,产品到公众认知不断涌现出重大突破,同时也吸引到大批投资。今年3月,来自量化分析公司 Quid 的数据显示,2010年以来,人工智能吸引超过200亿美元投资,过去四年风险投资平均每年增长62%,至2020年,全球人工智能市场规模将达到183亿美元,约合人民币1190亿元。数据的不断产生和融合,将为人工智能提供更大更深的发展空间。   目前,人工智能在医疗行业的应用主要包括医疗诊断、辅助治疗与健康管理、药物研发。人工智能在提高健康医疗服务的效率和疾病诊断准确率等方面上具有天然优势,在深度学习算法和大数据技术等的强力推动下, 各种旨在提高医疗体验以及降低医疗成本的先进应用正在应运而生。   国内
[医疗电子]
长城汽车:Coffee·AI系统打造全场景的智能空间座舱系统
智能座舱的发展趋势与整车的演变息息相关。随着时代的发展,传统燃油车已发生巨大变化,其中最为显著的是由化学燃料与机械电子的完美结合转变为汽车电动化和智能化。 2023年12月13日,在2023第五届智能座舱与用户体验大会上,长城汽车智能座舱研发总监颉毅表示,智能座舱在未来一定会与整车发生深度融合,分为三个方向:一是要树立用户使用智能驾驶的信心;二是智能座舱和智能手机深度融合;三是要结合AI赋能,通过语音或视觉提升主动服务的能力。 颉毅介绍,长城汽车打造了整车的智能化技术品牌Coffee · AI,包括座舱、驾驶、云平台、电子电气架构,基础是AI大模型,人工智能为其赋能,实现了新功能和新场景。 颉毅 | 长城汽车智能
[汽车电子]
长城汽车:Coffee·<font color='red'>AI</font>系统打造全场景的智能空间座舱系统
半导体行业格局新突破:新兴行业有望迎来爆炸式增长
看点 汽车半导体和人工智能芯片为半导体市场带来了新的发展机遇。 当前,我们使用的许多前沿数字化设备背后的技术都要依靠半导体才能实现。由于无人驾驶、人工智能、5G和物联网等新兴技术的发展,以及对技术研发的持续投入和市场主要参与者间的激烈竞争,未来十年全球半导体行业有望持续稳定增长。 半导体行业的兼并收购活动已经达到峰值,专业纵向整合逐渐成为行业重点。日本、韩国正力图通过收购重振本国半导体行业,而与此同时,持续的贸易战和知识产权纠纷将使中国在全球范围内的大举投资受阻。随着消费类电子产品需求饱和,半导体行业的增长将趋于平缓。然而,许多新兴领域将为半导体行业带来充分的机遇,特别是汽车和人工智能的半导体应用。 半导体行业
[嵌入式]
半导体行业格局新突破:新兴行业有望迎来爆炸式增长
机器视觉与AI的整合推动工业优化与自动化
在提升制造流程的效率及降低劳力密集度的过程中,机器人扮演了十分重要的角色。不但有助于控制成本并提升质量,还能增加生产力。不过,机器人系统设计的复杂性已经让许多制造商望之却步。此外,还要识别并整合多家厂商的子系统,更是让情况雪上加霜。 NEXCOM 子公司 NexCOBOT 提供了一套将人工智能 (AI) 与机器视觉整合并采用全新 Intel 视觉加速器设计产品的弹性模块化机器人解决方案。这套解决方案集结了人工智能的判断力、机器人的行动力与机器视觉的洞察力,为制造和工业实作带来全新层次的精确化与优化。 挑战 在各种不同的产业中,将制造流程优化的关键就是提高自动化。不过,传统的机器视觉有一些限制。一般而言,传统的机器视觉只能根据固
[机器人]
CES 2019前瞻:人工智能依旧是2019年主旋律
本周,一年一度的CES(国际消费类电子产品展览会)就将在美国召开。作为全球最大的电子产品展之一,CES每年都会吸引大批的企业参展,同时也是消费者们非常关注的盛会。今年的CES上会有那些重点技术会展示,会有哪些产品吸引大家眼球?那么我们就一起简单梳理一番。 多款手机亮相CES 虽说手机已经不是CES上的主角了,不少手机品牌都没有在CES上推出新品的计划,但依旧会有新品在CES 2019上亮相。索尼或将在CES上展示最新的中端产品Xperia XA3 Ultra。这款产品将会是前代XA2 Ultra的升级版,将采用6.5英寸的18:9屏幕,搭载骁龙660移动平台,6GB内存,后置双摄像头,以及侧面的指纹识别。 而另一个可能将会在C
[机器人]
联发科点出三大AI发展关键,降低训练成本/提升效能
人工智能(AI)发展如火如荼,从智能车载系统、家用语音助理,乃至侦测信用卡盗刷等智能犯罪防治机制等,逐步贴近人们的生活。 不过,联发科计算系统研发本部总经理陈志成于《产业升级之钥--人工智能创新应用国际论坛》指出,目前AI技术在发展上仍有诸多限制,若想在未来有更进一步的突破,高效能学习算法、边际运算与AI适用处理器等发展会是主要关键。 陈志成引用McKinsey近期相关报告说明,2016年全球仅有20%左右的公司将AI应用于产品、服务或内部管理,AI领域的投资总额却超过260亿美元,发展潜力之丰富可见一斑。 然而他也指出,AI虽在人脸、对象、语音识别等技术上表现优异,现阶段每个神经网络只能执行一种特定功能,难以扩大应用;而训练神经
[手机便携]
墨子智能首创作业辅导机器人,开拓AI教育应用新方向
墨子(深圳)人工智能技术有限公司首创推出“墨子(Mozi)作业机器人”。这款“人工智能+教育”产品,专门针对1-3年级孩子“作业辅导”这一普遍的“家庭教育痛点”而设计,助力培养孩子自主学习能力,实现家长解放和老师工作强度降低。 不同于现有市面上的教育APP、在线课程和教育机器人,墨子(Mozi)作业机器人培养孩子自主学习,而不是无论孩子知识点掌握与否,都要被动地接受同步课程视频录播。“墨子(Mozi)作业机器人”聚焦解决学生尤其是低年级学生写作业过程中遇到的问题,是国内首家针对“写作业”场景而专门设计的,是为解决“家庭教育痛点”而生。 “墨子(Mozi)作业机器人”针对“写作业”场景,从孩子、家长、老师三个维度入手,解决孩子学习遇
[机器人]
传苹果挖走华为荣耀53人AI团队
今日,有猎头向蓝鲸TMT透露劲爆消息,苹果的深圳研发中心整体挖走53名原华为荣耀AI研发团队。 对于此消息,记者第一时间向荣耀公关人员核实,对方表示不予评论。 有关荣耀AI研发团队被挖的消息虽未被证实,但此前苹果CEO的一番表态很是令人猜想。库克在接受《华盛顿邮报》采访时表示,“从长期着眼,我认为中国是一个令人难以置信的市场,不仅是它的市场需求和营收潜力,更因为这个市场中巨大的人才资源。” 更有业内人士已经捕捉到苹果在深圳布局研发中心的隐性企图,那就是贴近地域优势,向中国手机厂商寻找创新灵感。据元大证券分析师蒲得宇在最新一份调研报告中称,苹果将在明年下半年的新一代iPhone,至少会有一款配备后置三摄像头,也就是类似现
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved