陈天石:在AI“石器”时代保留火种

发布者:Yuexin888最新更新时间:2018-02-05 来源: 电子产品世界关键字:AI  芯片 手机看文章 扫描二维码
随时随地手机看文章

  有一句话形容现在的人工智能特别合适:“我们往往高估了目前,而低估了未来”。如果要以其提出到现在60余年为一个周期来看,它真正席卷人类社会,才刚刚开始。下面就随网络通信小编一起来了解一下相关内容吧。

  从这样的历史长河来看、从通用人工智能的未来回溯看,这个时代占据舞台中央的这些开拓者,都是手握着“深度学习”、“神经网络”等最原始的工具,在这块荒野上蹒跚前行。走在寻找人工智能基础工具这条路上,陈天石不比其他人多什么先决条件。

  幸运的是,从他创造的石器中,人们逐渐发现并保留了火种。

  寒武纪,这家背靠中科院计算所的创业公司刚亮相市场,就踏入了“独角兽”领域。

  打磨“石器”

  AI是一场革命。它和互联网一样,会席卷一切,会从无到有、再从有到无(无处不在)。普通人甚至不需要前行,它会主动过来拥抱你,甚至裹挟你。用罗振宇的话说:“你不必着急出发,因为你终将被抵达”。

  在这场基础设施重新定义的革命中,陈天石无疑是一个提前出发者。16岁考入中国科学技术大学少年班;2014年论文在美国召开的国际顶级学术会议上获得最佳论文奖;创办的公司寒武纪科技,A轮估值超过10亿美元,成为全球首个人工智能芯片“独角兽”、全球最大的AI芯片初创公司。

  基于深度学习这一底层算法,计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域取得了长足的进展。但传统的处理器例如CPU等,虽然是目前主流的AI计算平台,但是其基本框架结构毕竟不是为了AI所设计的,效率受到很多限制,包括GPU也有耗电量大等缺陷。

  如果要用通用处理器搭建一个人脑规模突触的神经网络,可能需要建一个电站来给它供电。阿尔法狗刚亮相时,下一盘棋动用了1000个CPU和200个GPU,每分钟的电费就高达300美元,而网络规模只有人脑的千分之一。

  陈天石认为,理想中的AI芯片应当是一种新型的处理器,能具有广阔的应用面(包括语音、语义、图像、视频、自然语言多模态处理能力),同时具备远超CPU和GPU的效率。要想达到这一目标,必须要有一套新的AI指令集,利用指令进行灵活处理,才有可能在AI芯片上把各种算法应用都能支持得又快又好。

  打个简单的比方,把摩托车(PC、手机等)的发动机(CPU)装到了汽车(深度学习平台)上,汽车自然开不快;现在,需要为汽车专门设计一款发动机(深度学习专用处理器)。

  “DianNao”这一深度学习处理器架构,平均仿真性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级。2014年,他和哥哥陈云霁以及法国信息技术研究院(Inria)的Olivier Temam教授合作的这篇论文,成为顶尖国际会议的最佳论文。

  2014年-2016年间,他们俩和国际学术合作者一道几乎横扫了处理器架构学术圈,在顶级学术会议上教老外说中文的Diannao系列:Diannao(电脑)、DaDiannao(大电脑)、PuDiannao(普电脑)、ShiDiannao(视电脑)、Cambricon(寒武纪指令集)等一系列创新,针对不同的目的,将目前深度学习的效率提高数百倍。

  有院士这样分析,“寒武纪”在深度学习处理器指令集上的开创性进展,为我国占据智能产业生态的领导性地位提供了技术支撑。自2014年中科院计算所和Inria联合团队提出首个深度学习处理器架构DianNao之后,深度学习处理器已经成为计算机体系结构国际会议ISCA最关注的研究方向之一。ISCA 2016上有近1/6的论文引用“寒武纪”的工作来进行深度学习处理器探索。

  “目前,像阿尔法狗这样的软件算法是在GPU上执行的,将来如果使用了‘寒武纪’处理器,深度学习(神经网络)的运算速度会得到明显提升。”陈天石说。

  他用“瑞士军刀和菜刀”来比喻通用处理器和深度学习处理器的关系:瑞士军刀虽然功能多,但是做菜的时候,还是菜刀更合适。在智能处理方面,“寒武纪”就是这把更合适的菜刀。

  寒武纪指令集直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。模拟实验表明,采用寒武纪指令集的深度学习处理器相对于x86指令集的中央处理器有两个数量级的性能提升。

  如今,通过在计算机中模拟神经元和突触的计算,寒武纪的AI芯片对信息进行智能处理,借助专门设计的存储结构和指令集,每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的十分之一,未来甚至有希望把类似阿尔法狗的系统装进手机。

  埋头“重工业”

  芯片是信息产业的“尖刀连”,更是“重工业”,其所需要的投入是巨大的,远远超过AI的其他领域。

  2017年8月,寒武纪科技获得了价值1亿美元的A轮融资,该轮投资由国投创业领投,阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点(天使轮领投方)、涌铧投资(天使轮投资方)联合投资。

  这家背靠中科院计算所的创业公司刚亮相,就进入市场,就踏入了“独角兽”领域。

  华为的旗舰手机Mate10采用了寒武纪1A处理器,这是寒武纪AI产业化的第一步。这款2016年发布的全球首款商用深度学习专用处理器IP,入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。

  它不仅具有完全自主知识产权,而且在计算机视觉、语音识别、自然语言处理等关键人工智能任务上具备出类拔萃的通用性和效能比,达到了传统的四核通用CPU25倍以上的性能和50倍以上的能效。

  “我们的产品寒武纪1A处理器,可以跟苹果产品一较高下,结果我们很轻松打赢了这场战斗。我们并不是靠着蛮力去堆运算器,而是依靠最先进的、稀疏化的技术,四两拨千斤,让华为Mate10的智能处理速度打败了强大的苹果iphoneX。”陈天石说。

  在将AI普惠化这一终极方向的指引下,他制定了自己的小目标。“我们现在与国外同行都是在同一个起跑线上的,希望寒武纪能在3年后占据中国高性能智能芯片市场30%的份额;在3年后,让全球有10亿台设备集成寒武纪处理器的智能终端。”

  他给出了实现的路径。关于寒武纪芯片的市场商业化推进:“一是终端,二是云端。终端产品就是智能手机、智能眼镜、无人机、自动驾驶汽车等,需要芯片去识别图像、影音和文字。而在云端,像科大讯飞(52.750, 0.34, 0.65%)、中科曙光(39.400, 1.59, 4.21%)等这样知名的云端客户,都已经是寒武纪的客户。”

  为了这个小目标,他说自己“除了休息的时间,都在工作”,拼了命地往前跑。在智能整个行业里面最上面是应用层,利用人脸识别、语义理解等,去系统集成自动驾驶、智能手机等产品。而“冰山”看不见的地方是技术层。

  而芯片是技术层的“地基”。“芯片就是像建房子或者修路这样的事,如果没有房子没有路事情没办法往后走,希望我们未来能够继续承担好智能时代的基础设施提供商的角色。”陈天石说。

  技术一定会带来人与人之间的鸿沟,而降低技术的门槛、创造尽可能的公平是消除这一鸿沟的几乎唯一可行的途径。

  “从个人角度出发,我们主要从事人工智能加速芯片的研发,可以让开发者获得更加廉价、高效的芯片,支持上层应用的开发。”陈天石说,只有整个计算系统更加廉价,才有希望推动人工智能的普惠化。因此在底层,降低功耗、提高效率是关键。

  至于上层应用,群众的智慧是无穷的。陈天石很乐观,他抱着乐见其成的态度来支持人工智能的发展,相信会在基础层之上,长出更多的应用。

  保留“火种”

  2017年底,一篇名为《芯片战国时代》的稿件在AI界很火,文章里说,“据CB Insights估算,进入新兴芯片初创公司投资总额从2015年的8亿美元增长到了2017年的16亿美元;创投库里,AI芯片公司从零星几家增长到20多家。光2017年下半年,台积电的生产线上就有超过30款AI芯片排队等着流片。”

  时也势也。能不能到达终点,不仅取决于奔跑的速度,更取决于所在的赛道。

  不只有初创公司在跑,实际上巨人们觉醒得比谁都快。就在前两天,芯片巨头英伟达在美国消费电子展召开发布会,宣布了一系列关于无人车机器学习芯片Xavier的相关内容。鉴于在AI芯片领域的表现,其股票2017年上涨接近100%,堪称“年度最佳理财产品”。

  更别说英特尔、谷歌、Facebook、微软等巨头也在为此倾尽全力。咨询公司Tractica的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由此前的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。

  生死搏杀,千亿市场在一战胜负。

  “芯片的成败,除了本身的效率之外,生态是非常关键的环节。没有配套的应用和软件,很难在市场上获得成功”。陈天石说,只要国产AI 指令集立住了,中国主导世界AI产业的机会可能就到来了。

  在寒武纪科技的第一场发布会上,他用了很长的时间去介绍自己的合作伙伴。他说,过去我们国内企业起步晚,一直是国际生态的跟随者。我们融入这个生态,享受这个红利,但我们并不能有多大的力量去改变这个生态。但是在智能时代,大家都在同样的起跑线上,要敢为天下先,敢于提出并共同构建全新的智能生态。“光有寒武纪是不够的,我们大家需要共同在硬件的指令集和软件的开发平台上下功夫,在端云结合上下功夫,在商业协作上下功夫”。

  2017年10月16日,陈天石发了一条朋友圈,“一事平生无齮(Yi)齕(He),但开风气不为师”。这句出自龚自珍的诗词,后来被很多教育界名士所引用。

  事后他回想,这大概是因为他的执拗。18年前,陈天石考入中国科技大学,随后师从陈国良院士和姚新教授,读人工智能方向的博士。将近20年,他只做这一件事,把最底层的生态基石也就是芯片要做好。“技术一定要是最好的。”

  过去是,现在是,将来无论公司走到哪一步,技术永远被摆在第一位。

    以上是关于网络通信中-陈天石:在AI“石器”时代保留火种的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字:AI  芯片 引用地址:陈天石:在AI“石器”时代保留火种

上一篇:抢在中国前面?美国运营商将在明年开启全美5G服务
下一篇:IEK:DRAM去年单价上涨55%,今年再涨32%

推荐阅读最新更新时间:2024-05-07 17:52

人工智能在医疗健康领域的应用
传统的药物研发领域存在巨大痛点。一是研发周期长,新药研发时间平均10年左右;二是费用高昂,每款新药的研发费用约15亿美元;三是成功率低,约5000种合成化合物中,仅1种能进入临床II期实验。   人工智能与药物挖掘的结合或极大地提高研发效率,降低企业成本。目前在北美地区已经出现了数家技术领先的初创企业,他们借助深度学习,与默克等传统药企及医药研究机构合作,在心血管药物、抗肿瘤药物、孤儿药和经济欠发达地区常见传染病(如埃博拉)治疗药等多领域取得新突破,并吸引了诸如Y Combinator、Khosla Ventures 和Data Collective 等优秀孵化器或风险投资机构的青睐。
[医疗电子]
<font color='red'>人工智能</font>在医疗健康领域的应用
华为海思5nm芯片或za8月交付,5nm工艺第三季度迎大规模出货
消息人士透露,海思5nm麒麟处理器在东莞、北京等地的验证情况良好,预计8月份开始大规模交付。 此前,外媒消息称,华为品牌2020年的旗舰机有望搭载最新款麒麟1020。麒麟1020预计今年Q3上市,采用ARM Cortex-A78架构和最先进的5nm工艺,每平方毫米可容纳1.713亿个晶体管,性能较前一代的麒麟990提升50%。 5nm工艺是目前世界上最先进的制程工艺之一。台积电计划将于今年4月份全面启动5nm芯片的量产。与7nm相比,N5工艺在性能上提升约15%,晶体密度增加80%,功耗有明显下降。 众所周知,台积电最大的客户是苹果。可以预见苹果秋季发布会新品极有可能采用5nm工艺。可以预见今年第三季度,5nm
[手机便携]
华为海思5nm<font color='red'>芯片</font>或za8月交付,5nm工艺第三季度迎大规模出货
避免渔翁得利,美欧将联手遏制芯片补贴竞赛
在欧美竞相提高半导体芯片本土生产之际,拜登政府的一名高级官员近日表示,美国和欧盟将宣布一项合作计划,以避免欧美之间展开 补贴竞赛 。    当地时间周日和周一,美国-欧盟贸易和技术理事会(TTC)第二次会议在法国巴黎举行。据称届时欧美官员将公布这一决定。    去年9月,美国-欧盟贸易和技术理事会在美国匹兹堡举行了首次会议。当时,美国和欧盟的官员就曾承诺,将深化跨大西洋合作,以加强芯片供应链,并采取更统一的方式监管大型全球科技公司。    而本次的第二次会议上,欧盟和美国将公布更多举措,深化双方在半导体等科技领域的合作。 “你会看到我们宣布……一项旨在确保供应安全的跨大西洋半导体投资方案,”一位高级政府官员透露。    这位官
[半导体设计/制造]
欧盟:建立欧洲微电子联盟,誓要占据全球20%的芯片市场
欧盟工业负责人Thierry Breton 周三(15 日) 表示,欧盟应追求生产至少占全球芯片和微处理器价值的五分之一,以更好地与美国和中国竞争。 Thierry Breton 指出,驱动联网汽车、智能手机和高性能计算机等各类产品的半导体,「是大多数关键和战略价值链的起点」。 Breton 说道:「欧洲在微电子领域没有自主权,就不会有数字主权。」欧洲目前在全球处理器和其他微电子产品产量中的占比不到10%。 Breton表示,他将探索建立欧洲微电子联盟,初始公共和民间投资总额至高达300亿欧元 (340亿美元 )。 欧盟官员提振本地芯片生产的计画与中国的战略一致,后者在寻求摆脱外国芯片进口。 「面对美国和中国之
[嵌入式]
MathWorks 宣布 MATLAB 与 NVIDIA TensorRT 集成来加快人工智能应用
MathWorks 近日宣布 ,MATLAB 现在可通过 GPU Coder 实现与 NVIDIA TensorRT 集成。这可以帮助工程师和科学家们在 MATLAB 中开发新的人工智能和深度学习模型,且可确保性能和效率满足数据中心、嵌入式应用和汽车应用不断增长的需求。 MATLAB 提供了一个完整的工作流程来快速训练、验证和部署深度学习模型。工程师可以使用 GPU 资源,而无需额外编程操作,因此可以专注于应用本身而不是性能调优。NVIDIA TensorRT 与 GPU Coder 的全新集成使得可以在 MATLAB 中开发深度学习模型,然后以高吞吐量低延迟的方式部署在 NVIDIA GPU 上运行。内部基准测试显示,MAT
[物联网]
分析师称 ChatGPT 每天运行开销达 70 万美元,微软开发自主芯片尝试降低成本
据报道,芯片行业研究公司 SemiAnalysis 首席分析师迪伦・帕特尔(Dylan Patel)表示,由于 ChatGPT 运行在价格昂贵的计算基础设施之上,OpenAI 每天为运行 ChatGPT 投入的成本可能高达 70 万美元(当前约 481.6 万元人民币)。 帕特尔指出,ChatGPT 需要庞大的算力,才能基于用户的输入信息做出反馈,包括撰写求职信、生成教学计划,以及帮助用户优化个人资料等。他表示:“大部分成本都来自于昂贵的服务器。” 此外,帕特尔最初的估计基于 OpenAI 的 GPT-3 模型,而在采用最新的 GPT-4 模型之后,ChatGPT 现在的运行成本可能更高。 对此,OpenAI 尚未对此
[物联网]
苹果明年手机芯片释新单英特尔、博通将全面对决
    近期半导体供应链传出苹果(Apple)有意在2015年释出部分手机新品芯片订单,给予高通(Qualcomm)以外的芯片供应商,苹果此举已在半导体产业掀起角力赛,目前业界多预期苹果新品芯片订单最后得主,应会在英特尔(Intel)与博通(Broadcom)之间二选一,此次苹果释单动作对于手机芯片厂而言将产生巨大影响,不仅攸关英特尔、博通手机芯片产品线兴衰,甚至将牵动全球手机芯片市场版图,这一场苹果手机芯片订单争夺战,将成为近期全球半导体产业重要战事之一。   半导体业者表示,苹果不断分散旗下产品关键零组件供应商,以降低营运风险,近期苹果分散供应商动作已从下游硬件代工转向上游半导体供应链,由于苹果旗下iPhone与i
[手机便携]
第五代至强AI跑分结果出炉:比第四代强1.42倍
AI领域永远都在革新。但随着大模型对算力需求的高速增长,现阶段生产的芯片很难满足业界需求。 前阵子,英特尔发布了第五代英特尔至强可扩展处理器,这款产品不仅在性能指标上有很大提升,在AI性能上也非常强劲。甚至可以说,能够胜任部分AI大模型的推理工作。 不过,口说无凭,唯有跑分才能证明真正的实力。 近日,MLCommons公布了针对AI推理的 MLPerf v4.0基准测试结果 。 比第四代强1.42倍 第五代至强内置了英特尔 ® 高级矩阵扩展(英特尔 ® AMX)的第五代英特尔 ® 至强 ® 可扩展处理器(以下简称“第五代至强”)在测试中表现优异,进一步彰显了英特尔致力于通过丰富且具有竞争力的解决方案
[嵌入式]
第五代至强<font color='red'>AI</font>跑分结果出炉:比第四代强1.42倍
小广播
最新网络通信文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved