Facebook研发新AI模型，动态人物视频也能造假-电子工程世界

近日Facebook发表了一篇关于从现实视频中提取角色的论文Vid2Game: Controllable Characters Extracted from Real-World Videos（Vid2Game：从真实世界视频中提取可控制的角色）。

在这篇论文中，Facebook提出了一个新的AI模型，这个模型可以对原始视频中的动态的角色进行定位和提取，提取后的角色可被开发者控制，并且添加上任意背景即可生成新视频。

一、AI如何将现实视频与游戏形象结合？

这个团队的方法依赖于两个神经网络，或者说是模仿生物神经元的数学函数层: Pose2Pose，一个将当前姿态和单一实例控制信号映射到下一个姿态的框架；Pose2Frame，将当前姿态和新姿态（以及给定的背景）一起放在输出帧上。这些操作可以由任何“低维”信号控制，比如来自操纵杆或键盘的信号。研究人员表示，该系统足够强大，可以在动态背景中定位提取图像，并将现有背景进行任意的更换，融合成新的图像后生成视频输出。

这种AI模型生成新的视频有两个具体步骤。首先，将包含一个或多个图像的输入视频输送到一个特定区域（如舞蹈）训练的Pose2Pose网络中，该网络将这些图像（加上预估的前景空间掩模）和它们的运动隔离开来，特定区域将作为它们质心的轨迹。（掩模用于确定哪些区域的背景被合成的图像信息所取代。）

然后，使用这些和组合而成数据，Pose2Frame将场景中与角色相关的变化（如阴影、被持有的物品和反射）和与角色无关的变化分开，最终可以形成任何想要的背景与动作的混合视频输出。

二、通过训练对比提取可控角色

为了训练这个AI系统，研究人员采集了三个视频，每个视频长度在5到8分钟之间。这三个视频分别为：一个网球运动员在户外、一个人在室内挥舞着剑、一个人在走路。

研究人员报告说，将这三个视频与传输舞者三分钟视频的神经网络模型相比，他们的方法成功地对动态元素进行了对比，如其他人和摄像机角度的差异，以及角色服装和摄像机角度的变化。

研究人员在论文中写道：“每个网络都解决了之前未完全满足的计算问题，同时为生成具有逼真图形的视频游戏铺平了道路。此外，从类似YouTube的视频中提取的可控角色可以在虚拟世界和增强现实中找到自己的位置。”

三、利用AI系统优化游戏成为热潮

Facebook并不是唯一一家研究可能有助于游戏设计AI系统的公司。

初创AI技术公司Promethean AI利用机器学习帮助人类艺术家为视频游戏创作艺术形象，利用自动化省去重复的建模工作。

AI视觉计算公司Nvidia的研究人员最近有展示了一种可以使用视频片段创建虚拟环境的生成模型。

机器学习也被用来优化复古游戏中的旧游戏纹理，如《最终幻想VII”和“塞尔达传说：暮光公主》，以及在游戏《毁灭战士》中从零开始生成数千个关卡。

结语：AI技术成为行业新突破

AI已经被越来越广泛的应用到了各个领域，各行业都在利用AI技术寻找新的突破口。

在图像处理领域，AI图像技术正在帮助游戏行业优化或者开发更有趣的产品，并逐渐成为游戏行业竞争的又一个重要因素。

关键字：Facebook AI模型 AI 引用地址：Facebook研发新AI模型，动态人物视频也能造假

上一篇：只闻其声也能“看透”你，来自“声音画像师”的秘密
下一篇：用5G网络播放全景VR视频，欧洲神秘研究机构的黑科技

推荐阅读最新更新时间：2024-11-04 07:25

人工智能（AI）的三大流派

　　人工智能（AI）是最近非常火的一个领域，很多公司都想趁着这个机会绑上AI的概念火一把。于是在业界也经常会听到各种各样AI相关的术语，比如：智能机器（smart machine），机器智能（machine intelligence），机器学习（machine learning），深度学习（deep learning）等等。　　为了更好地理解这些术语，需要了解当前 AI领域落地的三大流派，这三大流派被Numenta公司总结得很好了，我理解和归纳如下：　　1.经典人工智能　　这类人工智能的落地方案是通过积累大量的领域知识来让机器变聪明。计算机利用领域专家总结提供的规则（也就是“专家系统”）来解决某个具体的问题。比如通过向病

[机器人]

当人工智能遭遇量子计算，将是一次知识大爆炸？

人工智能的发展可能存在三个阶段：服务器时代、云计算时代、量子计算时代。现阶段人工智能基本只能依靠集中处理的方式实现相关功能和应用，也就是通过云计算的方式。根据我们的判断，量子计算有望给人工智能带来的变革性变化在于小型化和移动化。当量子芯片中的量子比特数量达到一定数量后，计算能力将满足人工智能对运算能力的需求，人工智能将不再依赖于大型服务器集群。未来量子芯片小型化后，人工智能前端系统的快速实时处理便成为可能，比如车载智能系统、无人机智能系统等。全球数据总量发展趋势（EB）　　量子计算发展历史　　 2017年5 月3 日，中科院宣布首台光量子计算机在我国诞生，标志着我国量子计算已处于世界领先水平。人

[嵌入式]

AI唤醒的世界——智能应用落地场景新观察

人工智能现在有多牛？近日，在主题为“聚焦人工智能，畅享美好未来”的第二十二届中国国际软件博览会第四场全球软件产业发展高峰论坛上，科大讯飞、京东和阿里巴巴的人工智能技术相关负责人，分享了AI应用落地场景的最新成果。 AI速记员：识别22种方言才稀罕软博会现场的环形屏幕上，演讲者的发言内容实时显示为字幕。科大讯飞副总裁李世鹏在演讲中表示，这正是科大讯飞的听见系统在做实时速记和翻译。听见系统是一位既“老实”也“不老实”的AI速记员。记者在现场看到，它会将演讲者口语中出现的“嗯”“啊”“这个”“那个”等语助词如实照写，而不是过滤掉；偶尔会将同音的“攻击”写成“公积”，大致是没“听懂”演讲者的原意。 “科大讯飞输入法不仅可以实时识别

[机器人]

马斯克：威胁人类的是深度人工智能，而不是自动化

　　特斯拉 CEO 伊隆·马斯克(Elon Musk)近期在 Twitter 上表示，人类应该担心的是深度人工智能，而不是自动化。马斯克正与其他科技行业领袖一同，开发保护性的技术措施，应对深度人工智能的发展。下面就随网络通信小编一起来了解一下相关内容吧。　　此前，有 Twitter 用户开玩笑地将来自 BI 关于特斯拉无人驾驶汽车的消息发送给马斯克，并要求他确认，“无需人工的自动化技术”不会导致“机器人末日”。马斯克在 Twitter 上重申了他此前的观点，即会给人类带来“末日”风险的并非自动化技术，而是深度人工智能。　　自动化技术带来的颠覆可能确实会令许多人感到不适，然而自动化技术本身并不是威胁。马斯克和其他科

[网络通信]

人工智能颠覆安防行业创新触点解决方案助力发展

人工智能在过去3年正加速发展。普华永道预计到2030年，人工智能会对全球经济作出15.7兆美元的贡献，更会提升中国26%的国内生产总值。在2019年，人工智能主要朝着面容辨识、人工智能处理器、深度学习及云应用等方面发展。当中人工智能的面容辨识及深度学习技术，可谓在安防行业成为了“颠覆性力量”，大幅推进新的应用及效率，加强保障个人及社会的安全。人工智能已经成为赋能实体经济、助推高质量发展的新动能。随着人工智能技术及应用高速发展，政府及企业目前正大举投资人工智能设备及基础设施，主要包括服务器、数据储存、终端及网络设备。当中的关键是要以高速运算人工智能应用，需要建立大量采用图像处理器的服务器，用于辨识影像与相片。例如，系统要 “观

[物联网]

<font color='red'>人工智能</font>颠覆安防行业创新触点解决方案助力发展

国际空间站新成员：AI机器人CIMON视频首秀

近日，欧洲航天局（ESA）发布了一段视频，该视频向我们展示了一款名叫CIMON的球形AI机器人，在国际空间站上完成了与宇航员的第一次互动。 ESA宇航员与Cimon 图片：ESA/NASA。 CIMON重约5公斤，有12个内部风扇，可让在空间站的微重力条件下漂浮，同时向多个方向移动。CIMON机器人具有移动摄影和摄像以及记录实验，搜索物品和维护库存的能力。从视频演示来看，CIMON能够回答一些基本问题，包括它的名字以及来自哪里等等，还能根据要求播放宇航员最喜欢的歌曲。有趣的是，在6点04分CIMON向一旁围观的宇航员问道：“难道你不喜欢和我在一起吗？”并迅速开始向甲板下沉，表现得像个三岁孩子。尽管目前来看，CIMON的行为还

[机器人]

英特尔豪掷10亿美元，开启买买买模式积极拥抱人工智能

　　今年，人工智能依然是所有巨头们重头戏，微软Build开发者大会上，人工智能和云是整个大会主角，同样，人工智能也是今年谷歌 I/O 大会核心，当下，没有比人工智能更热门的领域，自上世纪五年代，如今再掀热潮，成科技界最大风口。下面就随手机便携小编一起来了解一下相关内容吧。　　科技巨头开启买买买模式　　巨头们积极推动AI技术创新和发展，以此同时，涌现出无数创新创业企业，且备受资本市场关注，也备受科技巨头青睐，他们针对创新企业采取买买买模式，大肆投资和收购相关企业。　　在全球针对人工智能方面的投资，科技巨头成为核心力量，英特尔、谷歌、GE、三星和BAT等巨头是活跃投资者，早前多年前，巨头们就在人工智能爆发

[手机便携]

消息称 OpenAI 将推出大更新，助力开发者用 AI 模型做软件更快更便宜

10 月 12 日消息，据路透社报道，知情人士透露，人工智能公司 OpenAI 计划在下个月为开发者推出重大更新，以降低基于其人工智能模型的软件应用的开发成本和时间，该公司试图吸引更多的企业使用其技术。这些更新包括在其用于使用人工智能模型的开发工具中添加内存存储功能。理论上，这可以为应用制造商节省高达 20 倍的成本，解决合作伙伴的一个主要问题，即使用 OpenAI 强大的模型的成本可能会迅速积累，而他们则试图通过开发和销售人工智能软件来建立可持续的业务。 IT之家注意到，该公司还计划推出新的工具，例如视觉功能，将使开发者能够构建具有分析图像并描述它们的能力的应用，这在从娱乐到医疗等领域都有潜在的用例。这些新功能标志着该公司不

[物联网]

热门资源推荐
热门放大器推荐

小广播