AI版“双手互搏”有多牛?

发布者:caoxians4589最新更新时间:2018-03-22 来源: 电子产品世界关键字:AI  GAN 手机看文章 扫描二维码
随时随地手机看文章

  日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。下面就随网络通信小编一起来了解一下相关内容吧。

  什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

  中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

  故事中的GAN幻影

  张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

  这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

  在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

  他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

  在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

  王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

  这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

  让机器学会“左右互搏”

  GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

  一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

  明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

  正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

  于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

  在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

  张军平用几个比较火的人工智能应用场景举例——

  在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

  在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

  在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

  “不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

  GAN有什么“软肋”

  “毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

  首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

  其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

  第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

  最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

  因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

    以上是关于网络通信中-AI版“双手互搏”有多牛?的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字:AI  GAN 引用地址:AI版“双手互搏”有多牛?

上一篇:谋求垄断:云计算巨头的收购之战
下一篇:中国5G从试验田走向实质加速阶段

推荐阅读最新更新时间:2024-05-07 17:56

Meta、微软承诺购买AMD新型人工智能芯片Instinct MI300X,作为英伟达GPU替代品
12 月 7 日消息,当地时间周三 Meta、OpenAI 和微软在 AMD 投资者活动上表示,他们都将使用 AMD 最新开发的人工智能芯片 Instinct MI300X。这表明,虽然英伟达的 GPU 芯片对于开发和部署 ChatGPT 等人工智能程序至关重要,但很多科技公司都在寻找替代品。 如果 AMD 最新的高端芯片 Instinct MI300X 能在明年初开始出货,并满足人工智能公司和相关云服务提供商的需求,那么可能会降低开发人工智能模型的成本,并对英伟达不断飙升的人工智能芯片业务形成竞争压力。 周三 AMD 首席执行官苏姿丰表示:“所有的关注点都集中在云计算所用的大型处理器和大型 GPU 上。” AMD 表示,MI30
[物联网]
马云:未来世界变革的五大方向 人工智能是大趋势
  10月13日消息,在2016阿里云栖大会上,阿里巴巴董事局主席马云做了演讲,他指出,电子商务很快会被淘汰,这是个传统概念,明年阿里将不再提“电子商务”这一说。   阿里由电子商务起家,对电子商务冲击传统商业一说,马云再次否认了这一说法,他认为,电子商务没有冲击传统行业,电子商务的崛起是因为抓住了互联网技术,创造时适应时代发展的商业模式,传统商业的溃败是因为对未来的不拥抱。   马云还提出,未来30年是世界天翻地覆的30年,很多我们认为很正常的事情都会被颠覆和改变。这5个新的发展趋势将彻底改变我们的生活。   第一个新:新零售。马云认为,未来10年、20年,新零售将取代电子商务这一概念,这是线上线下与现代物流结合在一起创造出来
[机器人]
安世半导体推出“新老技术”融合的GaN新品,到底有何不同?
根据市场调研机构 Yole 的统计,2018 年全球 氮化镓 (GaN)功率和射频相加的市场规模仅有 4000 万美元,仅仅一年之后的 2019 年全球氮化镓半导体器件市场规模就达到了 9.749 亿美元,增速和增量惊人。 氮化镓被誉为继第一代 Ge、Si 半导体材料、第二代 GaAs、InP 化合物半导体材料之后的第三代半导体材料,具有带隙宽、导热率高、化学性能稳定、抗辐照能力强等特点,在光电子、高温大功率器件和高频微波器件等方面有着广阔的应用前景。 安世半导体 (Nexperia)于 2019 年进入高压宽带隙半导体市场。2019 年 11 月,安世半导体推出 650V 的功率器件 GAN063-650WSA,
[汽车电子]
安世半导体推出“新老技术”融合的<font color='red'>GaN</font>新品,到底有何不同?
人工智能、自动驾驶、新能源——东京车展三大关键词
  第45届东京车展27日正式开幕,世界主要汽车生产厂商用最新产品和技术描绘下一代汽车发展蓝图。从展会上不难看出, 人工智能 、 自动驾驶 和新能源是产业界共同认定的未来汽车发展方向。下面就随汽车电子小编一起来了解一下相关内容吧。     人工智能 更“贴心”    人工智能 近年来在汽车领域得到越来越多应用。本届东京车展上,奥迪公司展示了车载智能助理“PIA”,它能够综合分析来自车辆、驾驶员、交通状况等各方面的数据,主动提供合适的建议。比如,用户一上车,“PIA”就能读取用户手机上的日程安排并根据路况等信息确定路线,如果直接赶赴目的地时间尚早,它还会根据用户的习惯和爱好等,推荐用户去沿途一家餐厅就餐,或是进行其他活动。
[汽车电子]
摇滚机器人:白色条纹乐队的AI辅助视觉交响乐
地下动画师 Michael Warlla 顽皮地将艺术和技术融合在一起,使用 技术为白色条纹乐队(The White Stripes)歌迷心目中的神曲《Black Math》注入了新的活力。 该作为庆祝开创性的专辑《Elephant》发行 20 周年而发布。 作为一名漫画师和动画师,Wartella 以风格迥异的作品而闻名。 他在布鲁克林开设的 Dream Factory Animation 工作室将数字和实用动画技术与 AI 生成图像相结合,制作出了这个“Black Math”视频。 Wartella 表示:“这首歌已经有 20 年的历史了,我们想让它焕然一新,同时保留经典白色条纹乐队视频的
[机器人]
微软将推出第二代AI处理器 争夺AI行业领导权
【AI世代编者按】外媒报道,微软将于周一发布第二代HoloLens全息处理器,即一款新的AI处理器。这种AI处理器将使HoloLens能够实时分析看到的和听到的内容,而不必将数据传输到云端来处理。 科技公司热衷于让手机和增强现实设备具备AI功能。但是,这些公司面临一个很大的挑战:如何管理海量数据,以使AI功能在这些设备上成为可能,同时又不至于使设备运行速度变得太慢或者在几分钟内耗尽电池。 微软最近宣称,该公司已经找到了应对方案。微软为其HoloLens护目镜设计了一款芯片——一款新的AI处理器,能够在设备上实时分析用户看到和听到的内容,而不必将这些数据发送至云端,这样就可以节约宝贵的时间。 这款新的处理器是微软全息处理器(Holo
[半导体设计/制造]
四展联动汇集全产业,新变局、新升级,ELEXCON 2020预热在即
展望下半年,全球经济开始复苏,国内数字化加速,科技新基建助力,自主可控大势所趋,国产替代空间广阔。新变局、新升级!5G赋能千行百业,AI+IoT融合落地、汽车产业“新四化”,消费电子持续创新…… 重燃2020——抢抓万亿新基建新机遇,一起迎接电子行业市场反弹旺季!新展馆,新时间,打造电子领域全产业链一站式资源共享与合作平台,ELEXCON深圳国际电子展暨 5G全球大会(中国站)(以下简称:ELEXCON 2020)将于2020年9月9-11日正式登陆深圳国际会展中心『 宝安新馆 』,并以全新的面貌邀您开启新征程! ELEXCON2020聚焦九大热点 赋能产业复苏与升级 2020年《政府工作报告》中重点提到,5G
[物联网]
四展联动汇集全产业,新变局、新升级,ELEXCON 2020预热在即
利用FPGA在汽车、通信及AI领域创新
在当今快速发展的技术格局中,汽车、通信和工业市场处于数字化转型的最前沿。 由人工智能和机器学习驱动的先进技术开创了一个创新的新时代,技术先进的车辆重新定义了驾驶体验,5G 连接实现了无与伦比的处理速度,智能制造设施通过自动化彻底改变了工业工作流程。 在这些动态变化中,现场可编程门阵列 (FPGA) 已成为一项关键技术,为塑造自动化未来的创新解决方案提供支持。 FPGA 通过提供现场可重编程性、安全性、低功耗运行、高性能和实时网络来推动这场革命,以确保组织能够保持在数字化的前沿。 随着汽车、通信和工业组织中数字化的不断采用,利用 FPGA 功能和应用来释放创新的全部力量至关重要。下面,我们将详细分析技术进步如何增加这三个行业
[嵌入式]
利用FPGA在汽车、通信及<font color='red'>AI</font>领域创新
小广播
最新网络通信文章
换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved