人机“心电感应”!人类可以预测神经网络的错误分类 | Nature子刊论文
铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI
对抗图像是神经网络的顽敌,比如让AI错误检测路标信息、把乌龟认成步枪,都曾是对抗图像的“恶搞”。
当千辛万苦调试的神经网络遇到了对抗图像,一场你死我活的尊严战就开始了。
或许,人类可以理解并帮助神经网络进行判断。
约翰霍普金斯大学发表的最新论文Humans can decipher adversarial images显示,人类可以直观理解神经网络犯错的逻辑,并预测机器的错误分类。
目前,这篇论文已经被Nature子刊Nature Communications接收。
人机“心电感应”
在这个项目中,研究人员向人类志愿者展示了一些对抗性图片的图集,让人类判断神经网络会将这些图片认成什么。
这个图集本来是用来检测机器学习模型用的,里面的图像包含了一些微小的、不易被机器察觉的干扰。这48张显著对抗攻击产生的图像,都曾经击败过AlexNet和Inception V3等常用图像识别模型。
人类能猜出来神经网络是怎么想的吗?
这是一项庞大的工程,研究人员找来了1800名人类志愿者参与这个项目。他们将志愿者分成了8组,包括7个200名志愿者组成的组和1个400名志愿者组成的组,共进行7组实验。
为了保证参与者之间的多样性,每一组志愿者分别负责一组实验。
实验开始前,研究人员怎么也没料到,人类的直觉与神经网络的选择竟然可以这么相似。
实验开始
第一关,用多余的图像标签迷惑神经网络。
研究人员让人类依次识别48张图像,每一张图像给出两个标签,一个是机器为该图像选择的,另一个是从其他47张图像中随机抽取的。人类需要猜测,到底哪一个才是机器给出的标签。
结果发现,人类选择的图片标签中有74%与机器选择的标签一致,98%的人更倾向于选择与机器相同的标签,远高于50%随机选择概率。初步实验表明,人类的选择与机器有着惊人的普遍性。
人类与机器的思维有多相似?研究人员继续进行了下一场实验。
第二关,找出机器的首选与次选。
在这场实验中,研究人员要求人类为每张图像排序。他们用AlexNet模型给每张图像的首选标签和次选标签给人类,让人类猜测哪些是神经网络的首选。
结果依旧证明了实验一的结论,91%的选择与机器的首选一致,人类似乎真的能猜透神经网络的心。
研究人员加大难度,继续进行了第三场实验,多向分类。
这一次,人类志愿者需要处理的标签数量一下子从2个增加到48个:研究人员给定一张图片,让人类在48个可能的标签中挑选最符合图片内容的标签。
人类的判断与机器分类再一次重合,90%的人类与机器的首选一致。这些结果表明,人类与机器的错误分类具有一致性。
研究还在继续,难度仍在加大。
第四场实验看起来似乎有些“玄学”,判断雪花状电视图像中是什么。
比如下图这些类似电视没信号时出现雪花点:
你能猜出哪张里面包含一只知更鸟么?
这些图像看起来只是色彩块的集合,让人摸不到什么规律。仔细看会发现,每张图中央都会有一块色彩密集的区域,但是也看不出是什么。
但是,依然有80%的人类志愿者与机器达成一致。并且,人类为75%的图像选择的首选标签也是机器的首选图像。
此外,研究人员还进行了数字干扰实验、自然图像和局部扰动实验、3D物体实验。
7组实验下来,研究人员断定:人类的思维直觉与机器的相似性极高,因此人类可以预测机器会不会进行错误分类,进而预测、修正机器的判断逻辑。
黑盒,看起来也没有那么不可捉摸了。
传送门
论文Humans can decipher adversarial images地址:
https://www.nature.com/articles/s41467-019-08931-6#Sec1
VentureBeat报道:
https://venturebeat.com/2019/03/23/humans-can-predict-how-machines-misclassify-adversarial-images/
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
订阅AI内参,获取AI行业资讯
加入社群
量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;
欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
推荐帖子
- altium designer14已安装打开文件却显示要重装
- altiumdesigner14已经安装成功,但点开pcb文件时却显示要重装altiumdesigner。必须要从软件内才能打开文件。求教altiumdesigner14已安装打开文件却显示要重装以管理员身份打开再试或者没注册和谐成功重定向文件的打开方式就好了。
- adengj PCB设计
- 【R7F0C809】驱动VGA显示器硬件准备
- 好了,想了想对于新片子要折腾下一只想折腾的事情,最好是比较弱的芯片,这次正好了,用来驱动VGA也算是能把R7F0C809性能发挥到极限了,粗看了下手册没有发现超频的方法,有坛友知道的给讲讲啦。对于8位机驱动VGA显示器也算是有些年头了,很多年前老外都这么玩了,主要是这些芯片咯,罗列一下PIC16\\MEGA32\\AT89C2051等等吧。感兴趣的可以搜关键字tinyVGA能找到不少资源,大概评估了一下R7F0C809也算是基本上能驱动起来吧,可惜美中不足两点:无法超频,SPI速率最大只能到
- lyzhangxiang 瑞萨电子MCU
- 三极管工作原理分析,精辟、透彻
- 三极管原理对三极管放大作用的理解,切记一点:能量不会无缘无故的产生,所以,三极管一定不会产生能量,。但三极管厉害的地方在于:它可以通过小电流控制大电流放大的原理就在于:通过小的交流输入,控制大的静态直流。假设三极管是个大坝,这个大坝奇怪的地方是,有两个阀门,一个大阀门,一个小阀门。小阀门可以用人力打开,大阀门很重,人力是打不开的,只能通过小阀门的水力打开。所以,平常的工作流程便是,每当放水的时候,人们就打开小阀门,很小的水流涓涓流出,这涓涓细流
- Aguilera 模拟与混合信号
- 用51单片机实现温控、语音及数模转换功能
- SHX-51A开发板针对初学者设计,降低用户学习成本和加快用户快速进入单片机开发领域,提供一个帮助用户快速开始单片机学习之旅的硬件平台。本单片机实验平台提供大量的实用的实验例程和丰富硬件资源,并提供关于如何在本实验平台上实现仿真功能的制作过程,实现板上资源仿真和对外部仿真功能。板上提供ISP接口和40Pin的锁紧座,用户可以将器件放入锁紧座中,使用ISP下载线和ISP软件实现对芯片的编程和实验,最大限度的为用户节约学习成本和加快学习速度。SHX51B学习板针对初学者设计,以89C52与13
- ggggds 嵌入式系统
- TCP VS UDP (1)
- TCP(TransmissionControlProtocol,传输控制协议)是基于连接的协议,也就是说,在正式收发数据前,必须和对方建立可靠的连接。一个TCP连接必须要经过三次“对话”才能建立起来。三次对话的简单过程:主机A向主机B发出连接请求数据包:“我想给你发数据,可以吗?”,这是第一次对话;主机B向主机A发送同意连接和要求同步(同步就是两台主机一个在发送,一个在接收,协调工作)的数据包:“可以,你什么时候发?”,这是第二次对话;主机A再发出一个数据包确认主机B的要求同步:“我现
- 小龙王2010 Linux与安卓
- 《Cmake构建实战》第七章之实战演练
- #《Cmake构建实战》第七章之实战演练今天为大家分享一下《Cmake构建实战》第七章的学习内容。读了两遍第七章,我感觉内容略多,所以我的分享就以我的实现项目开发的使用视角来分享第七章这些属性与功能应用。本次示例以计算一串字符串的CRC16为示例做讲解。##应用场景1:生成可执行文件这是我们最简单的应用场景了。也是我们最常用的场景之一。我们首先tree一下我们的示例项目文件结构:通过上面的图片我们可以看到在app文件夹里面存放着应用层的.c/.h文件,主要包含main.c和ma
- lemonboard 嵌入式系统