英伟达“AI假脸王”开源：新一代GAN攻破所有人脸识别系统-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

还记得英伟达去年推出的StyleGAN吗？全新的生成器架构让这个“新一代GAN”生成的人脸真实到可怕。现在，StyleGAN已经开源，包括源代码和官方TensorFlow实现，附有详细使用说明。多说一句，还请谨慎使用，不要让StyleGAN成为第二个DeepFake。

还记得英伟达震撼世人的

新一代GAN

吗？

以假乱真的精细人脸生成，令不少研究人员都惊呼：已经无法分辨虚拟和现实！

上述人脸全部由计算机生成，StyleGAN的全新风格迁移生成器架构能控制发色、眼睛大小等脸部特征。来源：github.com/NVlabs/stylegan

论文、源代码、高清Flickr人脸图像数据集等所有的材料都公布了出来，非商业使用的情况下，这些素材任你使用和修改(Flickr人脸数据集参考另外的开源协议)。

Github库里还包含了一个基础的预训练StyleGAN生成器pretrained_example.py，下载后使用相关Python代码，就可以直接用来生成图像了。

另一个更高级的样例是generate_figures.py，这个脚本是用来生成论文中风格变换/混合、鼻子大小和发色调整等功能。

不过，需要提前说明的是，要生成1024*1024分辨率的图像，如果使用英伟达Tesla V100 GPU做训练，硬件配置和训练时间如下：

“使用较少的GPU可能无法实现与论文同样的效果——如果你想跟我们的技术一较高下，我们强烈推荐你使用同样数量的GPU。”

开源StyleGAN，莫非还有一丝卖显卡的因素(误)。

新一代StyleGAN：图像逼真到可怕，能生成世界万物

基于GAN的架构一个又一个推出，要是你一时间想不起来StyleGAN也没关系，多上几张图有助于你回忆：

这个模型并不完美，但确实有效，而且不仅仅可用于人类，还能用于汽车、猫、风景图像的生成。

英伟达研究人员在论文中写道，他们提出的新架构可以完成自动学习，无监督地分离高级属性（例如在人脸上训练时的姿势和身份），以及生成图像中的随机变化，并且可以对合成进行更直观且特定于比例的控制。

换句话说，这种新一代GAN在生成和混合图像，特别是人脸图像时，可以更好地感知图像之间有意义的变化，并且在各种尺度上针对这些变化做出引导。

例如，在上面的动图中，其实面部已经完全变了，但“源”和“样式”的明显标记显然都得到了保留。为什么会这样？请注意，所有这些都是完全可变的，这里说的变量不仅仅是A + B = C，而且A和B的所有方面都可以存在/不存在，具体取决于设置的调整方式。

而StyleGAN之所以强大，就在于它使用了基于风格迁移的全新生成器架构：

传统生成器架构和基于风格的生成器架构对比

在传统方式中，隐码(latent code)是通过输入层提供给生成器的，即前馈网络的第一层(图1a)。而英伟达团队完全省略了输入层，从一个学习的常量(learned constant)开始，从而脱离了传统的设计(图1b，右)。在输入隐空间Z中，给定一个隐码z，一个非线性网络 f：ZW首先生成w∈W(图1b，左)。

英伟达团队的生成器架构可以通过对样式进行特定尺度的修改来控制图像合成。可以将映射网络和仿射变换看作是一种从学习分布(learned distribution)中为每种样式绘制样本的方法，而将合成网络看作是一种基于样式集合生成新图像的方法。修改样式的特定子集可能只会影响图像的某些方面。

负责任地使用，避免成为又一个“DeepFake”

之前，大多数研究都集中在如何提高“换脸”技术上，也就是如何让计算机生成超逼真的人脸。

谁料，这种技术发展的滥用造成了反效果，也即所谓的“DeepFake”。现在，DeepFake已被用于指代所有看起来或听起来像真的一样的假视频或假音频。

去年底，Idiap 生物识别安全和隐私小组负责人 (注：Idiap研究所是瑞士的一家半私人非营利性研究机构，隶属于洛桑联邦理工学院和日内瓦大学，进行语音、计算机视觉、信息检索、生物认证、多模式交互和机器学习等领域的研究)、瑞士生物识别研究和测试中心主任 Sébastien Marcel 和他的同事、Idiap 研究所博士后 Pavel Korshunov 共同撰写了论文，首次对人脸识别方法检测 DeepFake 的效果进行了较为全面的测评。

他们经过一系列实验发现，当前已有的先进人脸识别模型和检测方法，在面对 DeepFake 时基本可以说是束手无策——性能最优的图像分类模型 VGG 和基于 Facenet 的算法，分辨真假视频错误率高达 95%；基于唇形的检测方法，也基本检测不出视频中人物说话和口型是否一致。

Pavel Korshunov 和 Sébastien Marcel 指出，随着换脸技术的不断发展，更加逼真的 DeepFake 视频，将对人脸识别技术构成更大的挑战。

“在 DeepFake 方法和检测算法之间的一场新的军备竞赛可能已经开始了。”

StyleGAN的开源，无疑也会增强DeepFake的制作。因此，谷歌大脑研究员Eric Jang呼吁，请负责任地使用！

关键字：人脸识别技术 NVIDIA 开源引用地址：英伟达“AI假脸王”开源：新一代GAN攻破所有人脸识别系统

上一篇：2019生物识别技术将进入大规模应用阶段
下一篇：谷歌官方推出密码检查工具帮助用户关注密码泄露问题

推荐阅读最新更新时间：2024-03-16 11:32

这款眼镜可以迷惑人脸识别技术

如今住在市区，很多地方都已纳入了摄像头的监控范围。虽然对人们人身财产安全有利，但从另一方面来看，个人隐私的泄露也是不可避免。随着人脸识别技术的进一步发展，人们在公共区域的隐私也岌岌可危，不仅是政府当局的摄像头，一些私人企业也能在自己的摄像头内收集到清晰的人脸图像。下面就随家用电子小编一起来了解一下相关内容吧。这款眼镜可以迷惑人脸识别技术如今住在市区，很多地方都已纳入了摄像头的监控范围。虽然对人们人身财产安全有利，但从另一方面来看，个人隐私的泄露也是不可避免。随着人脸识别技术的进一步发展，人们在公共区域的隐私也岌岌可危，不仅是政府当局的摄像头，一些私人企业也能在自己的摄像头内收集到清晰的人脸图像。在众筹网站 Ki

[家用电子]

这款眼镜可以迷惑<font color='red'>人脸识别</font><font color='red'>技术</font>

中国移动联合AT&T正式启动ONAP国际开源社区

eeworld网消息，在全球规模最大的开放网络峰会（ONS 2017）上，中国移动联合美国最大电信运营商AT&T和Linux基金会进行主旨发言，共同宣布启动全球最大的NFV/SDN网络协同与编排器开源社区——ONAP（Open Network Automation Platform）。ONAP开源社区由OPEN-O和ECOMP合并而成，该社区将凝聚全球产业资源，面向物联网、5G、企业和家庭宽带等场景，打造网络全生命周期管理平台，助力运营商下一代网络的全面转型与升级。中国移动研究院副院长杨志强在大会主题发言中表示：中国移动作为ONAP的创始白金会员，将努力推动ONAP开源生态建设，使运营商业务开发更灵活、业务上线更快捷、网络运维

[网络通信]

NVIDIA 发布量子-经典混合计算平台

社区中的全球领导者采用 NVIDIA QODA 统一编程平台, 支持量子加速 AI、HPC 以及健康和金融应用美国加利福尼亚州圣克拉拉——2022 年 7 月 12 日—— NVIDIA 于今日发布统一计算平台——NVIDIA 量子优化设备架构（QODA），以加快在人工智能（AI）、高性能计算（HPC）、医疗、金融和其他学科的量子研发突破。 QODA 旨在通过创建相干的混合量子经典编程模型，使量子计算更容易使用。QODA 是开放的、统一的环境，适用于当今一些最强大的计算机和量子处理器，提高了科学生产力，并使量子研究具有更大的规模。 HPC 和 AI 领域的专家能够使用QODA轻松地将量子计算添加至现有应用中—

[物联网]

<font color='red'>NVIDIA</font> 发布量子-经典混合计算平台

英伟达推出小型无人车人工智能电脑将用于百度无人驾驶

　　北京时间9月13日上午消息，美国芯片制造商英伟达周一展示了体积更小、效率更高的无人驾驶汽车人工智能电脑，并表示该产品将用于百度的地图和无人驾驶汽车技术。英伟达在北京举行的GPU技术大会上发布了这台电脑。该公司表示，百度将把这款名为Drive PX 2的电脑作为其无人驾驶系统的车载电脑。　　随着越来越多的汽车厂商制定了无人驾驶汽车开发计划，希望在未来10年甚至更短的时间内推出自己的无人驾驶汽车，英伟达也在努力降低该行业的进入门槛，通过强大的电脑为汽车厂商提供帮助。　　该公司本月早些时候宣布与百度达成合作关系，共同开发全面的无人驾驶汽车架构，不仅包括云端技术，还涵盖了融合双方人工智能技术的

[汽车电子]

英伟达被曝推迟发布面向中国的新芯片：最快2024年Q1登场

据国内多家媒体报道，英伟达推迟发布面向中国的人工智能新芯片，这颗芯片是H20，推迟到明年第一季度上市。据了解，英伟达面向中国市场开发了三款芯片，分别是H20，L20和L2，这三款芯片都是从H100的基础版修改而来，包含了英伟达用于人工智能工作的大部分最新功能。公开资料显示，今年OpenAI首次推出ChatGPT产品后，资本市场对生成性人工智能的关注度越来越高。目前英伟达在人工智能芯片市场占据主导地位，它在AI处理器市场上占据大约80%的份额，其高端处理器已被用于训练和运行各种聊天机器人。该公司备受投资者青睐，被认为是满足AI计算能力需求的关键供应商，支持谷歌的Bard和OpenAI的ChatGPT运行的都是英伟达的GPU。

[半导体设计/制造]

Nvidia：游戏是最热门App，云端移动技术是未来基石

在智慧型手机、平板电脑市场不得其门而入的绘图晶片巨擘Nvidia Corp.，现在转而把焦点放到游戏装置与汽车上，认为这两大领域蕴藏了庞大商机。 CNET News 19日报导，Nvidia执行长黄仁勋(Jen-Hsun Huang)在接受专访时表示，Nvidia不再以Tegra处理器专注智慧型手机、平板电脑市场的说法并不太对，应该要以公司策略转向来看待。他说，行动市场并非只有手机一种产品，除了电视、电脑出现行动革新外，游戏、汽车也都将获得创新。他说，Android作业系统的游戏市场未来会日益重要，而Nvidia希望能专注于此；除了游戏机外，专为游戏设计的机上盒、着重游戏的平板电脑都很重要。他说，平板电脑除以设计

[手机便携]

英伟达确认为中国推三款改良AI芯片性能暴降80%

11月13日消息，据国内媒体报道称，英伟达为中国推出的最新改良版AI芯片，预计会在今年11月至12月送样，而量产时间为今年12月至明年1月。报道中提到，英伟达的这三款AI芯片并非“改良版”，而是“缩水版”，其分别是HGX H20、L20 PCle和L2 PCle。用于AI模型训练的HGX H20在带宽、计算速度等方面均有所限制，理论上，整体算力要比英伟达 H100 GPU芯片降80%左右。尽管相比H100，HGX H20价格会有所下降，但预计该产品价格仍将比国内AI芯片华为的910B高一些。美国上月突然宣布，最新AI芯片管制提前生效，这就导致英伟达不得不断供一些正在进行的订单。英伟达表示，影响适用于“总处理性能（TPP）

[半导体设计/制造]

开源云计算技术选择

开源云计算技术有很多，包括Eucalyptus、OpenNebula和OpenStack等。其中很多开源技术都存在商业版，导致开源的版本功能很少或者不完善。我选择用OpenStack来实现开源云构建，因为OpenStack是完全开源的技术，没有任何收费版本或者商业版本。OpenStack是由Rackspace和NASA共同开发的云计算平台，帮助服务商和企业内部实现类似于AmazonEC2和S3的云基础架构服务（Infrastructure as a Service，IaaS）。OpIenStack包含两个主要模块：Nova和Swift，前者是NASA开发的虚拟服务器部署和业务计算模块；后者是Rackspack开发的分布式云存储模块

[网络通信]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！