AI假脸王生成！新一代GAN攻破几乎所有人脸识别系统-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

根据一篇针对计算机生成的假脸假视频DeepFake较为全面测评的论文，现有的先进人脸识别算法在面对计算机生成的假脸时基本束手无策，假脸生成算法和人脸识别军备竞赛已经开始。不过，目前还有些小技巧，可以帮你用肉眼来分辨计算机生成的假脸。

2015年，现任教皇方济各 (Pope Francis) 访美，他是首次对美国进行正式访问的教皇，还将主持在美国领土上的首次封圣，并在国会发表演讲。时任美国总统和副总统的奥巴马及拜登，分别携各自的夫人，一起在美国安德鲁斯空军基地 (Andrews Air Force Base，也是总统机队“空军一号”的驻地) 迎接了教皇专机的降临。

访问期间，方济各“一个出人意料之举”震惊了世界：只见他在向圣坛礼拜后，转身顺手将桌布一抽，上演了一出绝妙的“抽桌布”戏法，动作之行云流水，令人膜拜。

教皇竟然还会这一手！相关视频很快就火遍了全美乃至全球。

2015年现任教皇访美，上演绝妙“抽桌布”戏法，美国主教看后表示不爽。当然，这段视频是假造的，但这并不影响其流行。来源：CNN

世人震惊之余，几乎都没有怀疑——这个视频当然是假造的。

在“毫无PS痕迹”的说法还十分流行的2015年，这个“毫无PS痕迹”的视频成了后来被称为DeepFake视频的始祖。

现如今，DeepFake已被用于指代所有看起来或听起来像真的一样的假视频或假音频。

日前，Idiap 生物识别安全和隐私小组负责人 (注：Idiap研究所是瑞士的一家半私人非营利性研究机构，隶属于洛桑联邦理工学院和日内瓦大学，进行语音、计算机视觉、信息检索、生物认证、多模式交互和机器学习等领域的研究)、瑞士生物识别研究和测试中心主任 Sébastien Marcel 和他的同事、Idiap 研究所博士后 Pavel Korshunov 共同撰写了论文，首次对人脸识别方法检测 DeepFake 的效果进行了较为全面的测评。

他们经过一系列实验发现，当前已有的先进人脸识别模型和检测方法，在面对 DeepFake 时基本可以说是束手无策——性能最优的图像分类模型 VGG 和基于 Facenet 的算法，分辨真假视频错误率高达 95%；基于唇形的检测方法，也基本检测不出视频中人物说话和口型是否一致。

Pavel Korshunov 和 Sébastien Marcel 指出，随着换脸技术的不断发展，更加逼真的 DeepFake 视频，将对人脸识别技术构成更大的挑战。

“在 DeepFake 方法和检测算法之间的一场新的军备竞赛可能已经开始了。”

面对假脸生成算法，现有人脸识别系统几乎束手无策

针对 Deepfake 视频中人脸识别的漏洞，两人在论文中对基于VGG和Facenet的人脸识别系统做了漏洞分析，还使用SVM方法评估了 DeepFake 的几种检测方法，包括嘴唇动作同步法和图像质量指标检测等。

结果令人遗憾——

无论是基于VGG还是基于Facenet的系统，都不能有效区分GAN生成假脸与原始人脸。而且，越先进的Facenet系统越容易受到攻击。

VGG模型是2014年ILSVRC竞赛的第二名，第一名是GoogLeNet。但是VGG模型在多个迁移学习任务中的表现要优于googLeNet。而且，从图像中提取CNN特征，VGG模型是首选算法。它的缺点在于，参数量有140M之多，需要更大的存储空间。但是这个模型很有研究价值。

Facenet该模型没有用传统的softmax的方式去进行分类学习，而是抽取其中某一层作为特征，学习一个从图像到欧式空间的编码方法，然后基于这个编码再做人脸识别、人脸验证和人脸聚类等。

直方图显示了基于VGG和Facenet的人脸识别在高质量人脸交换中的漏洞。

检测Deepfake视频

他们还考虑了几种基线Deepfake检测系统，包括使用视听数据检测唇动和语音之间不一致的系统，以及几种单独基于图像的系统变体。这种系统的各个阶段包括从视频和音频模态中提取特征，处理这些特征，然后训练两个分类器，将篡改的视频与真实视频分开。

所有检测系统的检测结果如下表所示。

说明一下表格中各种“符号”和数字的意思，你也可以直接跳过看本节最后结论：

在本系统中，使用MFCCs作为语音特征，以mouth landmarks之间的距离作为视觉特征。将主成分分析(PCA)应用于联合音视频特征，降低特征块的维数，训练长短期记忆(long short-term memory, LSTM)网络，将篡改和非篡改视频进行分离。

作为基于图像的系统，实现了以下功能:

Pixels+PCA+LDA：使用PCA-LDA分类器将原始人脸作为特征，保留99%的方差，得到446维变换矩阵。

IQM+PCA+LDA：IQM特征与PCA-LDA分类器结合，具有95％保留方差，导致2维变换矩阵。

IQM + SVM：具有SVM分类器的IQM功能，每个视频具有20帧的平均分数。

基于图像质量测度(IQM)的系统借鉴了表示域(domain of presentation )的攻击检测，表现出了较好的性能。作为IQM特征向量，使用129个图像质量度量，其中包括信噪比，镜面反射率，模糊度等测量。

下图为两种不同换脸版本中性能最好的IQM+SVM系统的检测误差权衡(DET)曲线。

IQM + SVM Deepfake检测

结果表明：

首先，基于唇部同步的算法不能检测人脸交换，因为GAN能够生成与语音匹配的高质量面部表情；因此，目前只有基于图像的方法才能有效检测Deepfake视频。

其次，IQM+SVM系统对Deepfake视频的检测准确率较高，但使用HQ模型生成的视频具有更大的挑战性，这意味着越先进的人脸交换技术将愈发难以检测。

假脸生成和真脸识别算法军备竞赛已经开始

之前，大多数研究都集中在如何提高“换脸”技术上，为了响应公众对检测”换脸“技术的需求，越来越多的研究人员开始研究数据库和检测方法，包括使用较旧的换脸方法Face2Face 生成的图像和视频数据，或使用Snapchat应用程序收集的视频。

在Pavel Korshunov 和 Sébastien Marcel写的这篇最新论文中，作者提供了首个使用基于开源GAN方法进行换脸的开源视频数据库。

他们从公开的VidTIMIT数据库中，手动选择了16对长相类似的人，将这32个目标都训练两种不同的模型，分别为低质量 (LQ) 模型，输入/输出大小为64×64，以及高质量 (HQ) 模型，输入/输出大小为128×128尺寸的模型（参见图1）。

图1：来自VidTIMIT数据库原始视频，以及低质量（LQ）和高质量（HQ）Deepfake视频的屏幕截图

为了让其他研究人员能够对其成果进行验证、复制和扩展，作者还提供了他们在研究中使用的Deepfake视频数据库、人脸识别系统和Deepfake检测系统，并将相应的分数一起以Python开源包的形式放出。

肉眼分辨计算机生成假脸的一些技巧

就在不久前，

英伟达发表论文，展示了计算机生成的逼真到恐怖的人脸图像。对于虚假视频泛滥的网络来说，这可能导致一场迫在眉睫的“真相危机”。

英伟达新一代GAN生成的人脸，全都是不存在的人

以下图片是从Nvidia的最新论文中获取的截图。看看这份指南里是怎么说的吧。

不对称的面部特征、配饰

上面的图片有一堆可疑的线索。最简单的就是，此人头顶位置出现的大块的怪异斑点。这种现象或像差在AI生成的图像中很常见，与几年前谷歌的DeepDream实验的表现一致。

但是，当你环顾这个人的耳朵时，会发现图像略微不对称。一侧头发显得模糊而且看上去很奇怪，且一只耳朵上没有耳环。

算法不具备常识，并且不懂规则，比如不知道耳环一般要两只耳朵都戴。因此，AI算法有时无法生成足够真实的面部特征或首饰等。

牙齿

AI算法不知道正常人应该有多少颗牙以及这些牙齿的朝向。一般AI算法不会选择多角度描绘出这些牙齿的样貌，而是乱来一气。图中的虚假头像的牙齿就是典型例子。

上面这张图可能稍微难辨别一点，但如果你仔细看她的牙，会发现她中间第三颗牙异常地小，而且耳朵也非常不自然，所以这也是一张生成的假头像。

衣服和背景

上边图中的女性的衣服明显有问题，此外注意这张图片的背景也很奇怪，此外右侧的头发和耳环部分都很不自然，而且耳环只有一只。

上图中，人物的衣服实在太奇怪了，图中左侧的耳朵上并未戴耳环等配饰，但衣服上方却出现了一个悬在空中的“不明装饰物”，这种现象在AI生成的虚假图像中也不少见。

关键字：AI GAN 人脸识别引用地址：AI假脸王生成！新一代GAN攻破几乎所有人脸识别系统

上一篇：2018年行业最关心的“安防+AI”问题解答
下一篇：细思极恐！黑客用假手破解静脉识别门锁

推荐阅读最新更新时间：2024-03-16 11:31

风河CTO：在5G和边缘AI时代构建智能系统

本文作者：风河CTO Paul Miller 更多的计算和处理能力将部署在网络边缘，以提供积极、强大和安全的用户体验。这种计算和处理要求将增加网络体系结构的复杂性，并要求更高，更细致的管理和维护水平才能有效地工作。随着连接设备数量的成倍增长，企业将需要设计智能系统以确保有效地协调这些设备。通信服务提供商和全球企业已经开始围绕智能边缘和5G建立和塑造其业务模型。5G支持的绝大多数企业用例位于网络边缘，这得益于超低延迟通信和提高的网络速度，智能系统对于支持和协调5G的生态系统至关重要。边缘系统的引入意味着高度物理分布式架构部署，这带来了极大的操作复杂性。毫不奇怪，人工智能将在智能边缘设备的创建中扮演关键角色，在智能边缘

[嵌入式]

湖北移动“AI机器人”加入战“疫”队伍

当前，湖北疫情防控进入最吃劲的关键期，为了更高效且无接触地开展疫情信息的通知和排查工作，湖北省正在借助AI智能语音机器人在全省开展疫情智能排查外呼。 “XXX吗？请问您现在在武汉吗？请问您和家人体温是否全部正常？”2月17日，湖北省武汉市江岸区居民收到了这样的智能语音电话。据了解，为了积极响应国家加强疫情监测和报告的要求，做好密切接触者的追踪管理，湖北移动协同中移在线服务有限公司充分发挥行业优势，承担了湖北省防疫指挥部96120居民健康随访外呼项目建设。根据湖北省疫情防控指挥部、湖北省通信管理局的要求，双方联合上线了“智能外呼”。该产品利用云客服定时外呼实现智能疫情排查，通过高效、持续、科学的信息收集、跟踪和分析，提升信息收集效率

[机器人]

5G+AI时代下，机器人将迎来怎样的产业未来？

自2019以来，技术发展捷报频传，和算力持续增强，信息传达的速度更为高效、精准，抗干扰的能力更强。中国作为率先抢占5G技术高点的国家，以迅雷之势发展5G相关产业及其应用，产业与5G技术的高度贴合，更是得到了高端信息技术制造业的高度认同。有相关数据显示，中国机器人市场发展蓬勃，2021年预计规模就达839亿美元，与服务机器人几乎平分秋色。而伴随着5G技术的不断演进，机器人产业更是不断地向更高阶的应用场景发展，例如可远程控制的医疗机器人、街道马路上避障的机器人、复杂地质环境里自由穿梭的探测机器人、火灾等特殊现场来去自如的消防机器人...... “千奇百怪”的机器人在社会的呼声里应运而生，解决了诸多复杂繁重场景的操作问题，代替了大

[机器人]

ChatGPT开启交互革命，AI服务机器人拐点来了？

引言：一个全世界范围内的现象级应用，正在引爆各大产业对人工智能的强烈关注，尤其将科技行业推向空前的机遇期。语言，人类之所以为人的标志。通过语言，人与其他动物（或事物）区别开来，并借此形成独特的思维模式，并不断提升智性水平，最终确立人的主体性地位。从某种程度上说，是语言造就了人类。关于语言的力量，尤瓦尔·赫拉利在他的《人类简史》中曾提到，七千万年前，“某次偶然的基因突变，改变了智人大脑内部的连接方式，让他们以前所未有的方式思考，用完全新式的语言来沟通。”正是得益于这种独特的思维方式和语言沟通，智人最终征服了世界。而七千万年后的今天，在人类世界之外，一种新的思维和语言正悄然兴起……这种依托计算机科学发展起来的技术，被冠之以“人工

[机器人]

AI芯片获给用户一个真正的理由来升级智能手机

近年来，人工智能火热，科技巨头们纷纷发力人工智能领域。人工智能已经成为苹果，三星和LG等手机制造商的流行语。AI无处不在。例如，Facebook首席执行官马克扎克伯格(Mark Zuckerberg)在本周向美国国会提交近10个小时的证词期间，曾数十次提及AI，当时他指的是解决虚假账户和错误信息等问题的潜在解决方案。 Linley集团分析师Linley Gwennap表示：“大多数高端智能手机都有一个AI加速器，包括 iPhone X的Apple A11芯片和Galaxy S9的三星Exynos 9810。他在上周举行的芯片分析公司处理器大会上表示：“我们已经看到它逐渐渗透到中高端手机市场，并且随着时间的推移，它可能会继续渗透

[嵌入式]

“AI＋3D视觉直面工业制造柔性自动化挑战

【文/sya】“如果用终局思维来看当前的自动化，未来的智慧工厂大部分是柔性化、多品种、小批量、定制化的生产模式。视比特（上海）总经理周红谱在12月16日高工机器人年会上分析，随着AI技术的成熟，AI+机器视觉将会在工业制造业的发展中发挥重要作用。从智能产线设计端来看，可通过数字孪生、仿真软件，提前对数字化工厂进行设计、模拟、仿真，提前规避现场实施的难点；从生产执行端来看，如何让生产线更加柔性化、智能化，这就需要借助先进的AI+机器视觉技术，帮助智能机器人提高生产效率；从物流端来看，厂商可通过AGV、立库、WSM来让智慧物流提高运转、配送效率；在运维端，厂商可通过数据化的管理，借助AI算法智能预测及智能调度，

[机器人]

“<font color='red'>AI</font>＋3D视觉直面工业制造柔性自动化挑战

Efinix可编程芯片：可进一步推动人工智能技术发展

在 Efinix 公司联合创始人看来，他们研发的可编程芯片应该在正确的时间出现在了正确的地方。如今，工程师们正在努力将人工智能技术（特别是深度学习变体）“压榨”进芯片里，但是却一直受到成本和能耗的限制。 Efinix 公司总部位于美国加利福尼亚州圣克拉拉市，他们计划用一种全新的现场可编程门阵列（FPGA）技术来设计芯片，不仅芯片尺寸只有现在的四分之一，而且能耗只有传统芯片的一半，结构也没有过去那么复杂了。Sammy Cheung 是该公司联合创始人、总裁兼首席执行官，他表示，Efinix 公司把此技术称为量子可编程技术。过去，训练人工智能和深度学习需要依赖中央计算机和服务器产生大量数据，而现在，依靠这一系列优化功能组合，可以推动人

[嵌入式]

AI持续发热，Arm新一代Neoverse CSS V3和CSS N3为客户释放最优性能

AI热潮不仅没有熄火，反而愈演愈烈。2024年，由于市场对于AI硬件的需求永不满足，计算处于变革阵痛中。随着人工智能 (AI) 渗透到教育、就业、制造、医疗和交通等领域，AI 正在改变经济发展和我们的日常生活，而 Arm 是这一切改变的基石。 5年前，Arm 宣布了针对服务器、云和基础设施 CPU 内核的 Neoverse 计划。彼时，Arm制定了一项雄心勃勃的计划，计划开发V、N、E三个CPU内核系列产品，以满足市场的不同细分市场。虽然后续发展与Arm最初预测略有不同，但基于 Neoverse内核定制CPU的设计已经逐渐成为云服务商采用的风潮。日前，Arm推出新一代Neoverse CPU内核和计算子系统（CSS）——

[半导体设计/制造]

<font color='red'>AI</font>持续发热，Arm新一代Neoverse CSS V3和CSS N3为客户释放最优性能

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■有奖直播报名:大联大世平集团&恩智浦 | AI 无所不在，单板电脑也可以

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■Follow me第二季第4期来啦！与得捷一起解锁蓝牙/Wi-Fi板【Arduino Nano RP2040 Connect】超能力！

■嵌入式工程师AI挑战营（进阶）：基于RV1106部署InsightFace算法，实现多人的实时人脸识别