AI 正赢得夺旗游戏，是否能成功转化到现实世界？-电子工程世界

国际象棋和围棋曾是孩子的游戏。现在AI正在赢得夺旗游戏。这些技能最终会转化到现实世界吗？

孩子们会在夏季营地开放空间玩夺旗这个游戏；同时，争夺旗子这个游戏画面也是Quake III和Overwatch等热门游戏的一部分。

无论是哪种情况，这都是一项团队运动。每一方都守卫一面旗帜，同时还要计划如何抓住对方的旗帜并将其带回到自己的大本营。赢得比赛需要良好的老式团队合作以及协调防守和攻击之间的平衡。

换句话说，夺得旗帜需要一套看起来似乎只有人工才能操作的技能。但伦敦一家人工智能实验室的研究人员表明，机器也可以攻克这项游戏，至少在虚拟世界中是可以的。

在五月三十日发表在《科学》杂志上的一篇论文中，研究人员称他们在Quake III游戏的夺旗环节中设计了自动“代理人”，这些“代理人”表现的就跟人类在操作一样。这些代理人能够自行组队来对抗人类玩家，也可以与他们并肩作战，根据情况相应地调整自己的行为。

隶属于Alphabet的DeepMind实验室的研究员Wojciech Czarnecki表示：“这些代理人可以适应具有任意技能的队友。”

通过数千小时的游戏，代理人学会了非常特殊的技能，比如在队友即将获得旗帜的情况下极速跑去攻击对手的大本营。正如人类玩家所知，当对方旗帜被夺得并带到自己的大本营时，对家的大本营中会出现一面可以抢夺的新旗。

DeepMind的项目是努力构建人工智能应用于复杂三维动画游戏的一部分，这些三维动画游戏包括Quake III、Dota 2和星际争霸II。许多研究人员认为：虚拟领域的成功最终将提升现实世界中人工智能的应用能力。

例如，这些技能可以使仓库机器人受益——当他们分组工作将货物从一个地方移动到另一个地方时，或者帮助自动驾驶汽车在交通拥堵时集中导航。位于旧金山的OpenAI实验室有着类似研究项目，项目负责人Greg Brockman说道：“游戏一直是AI的基准。如果不能攻克游戏难题，就不能指望AI解决其他问题。”

直到最近，在像Quake III这样的游戏中构建一个可以匹配人类玩家的系统才成为可能，以前看来似乎是不可能的。但是在过去的几年里，DeepMind、OpenAI以及其他实验室取得了重大进展，这要归功于一种称为“强化学习”的数学技术，这种技术使得机器能通过极端的反复试验和试错来学习。

通过一遍又一遍地玩游戏，这些自动代理人可以了解哪些策略能成功，哪些策略不成功。如果代理人在队友即将夺旗的情况下通过向对手的大本营移动而不断赢得更多积分，则会将这种策略添加到他的游戏策略中。

在2016年，同样使用这项基础技术，DeepMind研究人员构建了使得AlphaGo在东方围棋游戏中击败世界顶级玩家的系统。鉴于围棋游戏的巨大复杂性，许多专家曾认为这种突破不会这么早实现，而是起码将在未来十年内完成。

尤其是当涉及到队友之间的协调时，第一人称视频游戏的复杂程度是呈指数级的增长的。DeepMind的代理人通过大约45万轮游戏来学习如何夺得旗帜，在数周的训练中便积累了需要大约4年的游戏经验。起初，代理人惨遭失败。但通过学习突袭对手大本营时应该如何追随队友，他们逐渐了解到了这个游戏的精髓。

在完成这个项目以后，DeepMind的研究人员还设计了一个可以击败星际争霸II专业玩家的系统。在OpenAI实验室，研究人员构建了一个掌握Dota 2的系统，Dota 2这个游戏就像夺得旗帜的加强版本。今年四月，由五名代理人组成的团队击败了由五名世界上最优秀的人类玩家组成的玩家团队。

去年，人称Blitz的专业Dota 2玩家兼评论员William Lee与代理人进行过一对一比赛，当时的版本不允许团队战；在当时，William对此表示兴趣平平。但是当代理人继续学习比赛并且参加团队战时，他对代理人的技巧感到震惊。

他说：“我曾经以为机器不可能打五对五的，更不用说赢了。我绝对被征服了。”

这种技术在游戏中的应用令人印象深刻，但许多人工智能专家质疑它是否最终能转化为解决现实问题。专注于人工智能的乔治亚理工学院计算机教授Mark Riedl质疑到：DeepMind的代理人事实上并没有真正在合作。他们只是回应游戏中发生的事情，而不是像人类玩家那样互相交换信息。（甚至渺小如蚂蚁也可以通过交换化学信号进行协作。）

虽然结果看起来像是协作，但这是因为代理人作为个体本身是可以完全理解游戏中发生的事情。

负责该项目的另一位DeepMind研究员Max Jaderberg则表示：“如何定义团队合作并不是我想要解决的问题。但是一名代理人在对手的大本营坐等旗子出现这种情况，只有在依靠队友时才有可能出现。”

像这样的游戏并不像现实世界那么复杂。Riedl博士说到：“3D环境旨在使导航变得容易。Quake的战略与协调很简单。”

强化学习非常适合这类游戏。在视频游戏中，很容易识别成功的指标：获得更多的得分。但在现实世界中，没有人能保持得分。研究人员必须以其他方式定义成功。

这一点是可以实现的，至少在简单的任务中。OpenAI的研究人员训练了一个机器人手像孩子一样来操纵字母块——告诉它给你看字母A，它就会拿字母A给你看。

在谷歌机器人实验室，研究人员已经证明机器可以学习拾取随机物品，例如乒乓球、塑料香蕉，并将它们扔到几英尺外的垃圾箱里。这种技术或许在将来可以应用到亚马逊、联邦快递和其他公司运营的大型仓库和配送中心。目前，这些工作还是由人类工作者来完成的。

如DeepMind和OpenAI这样的实验室要想解决更大的问题，他们可能开始需要大量的计算能力。因为OpenAI的系统在几个月内通过完成需要多年时间才能完成的45万多轮游戏学会了玩Dota，这依赖于成千上万的计算机芯片。Brockman表示光买这些芯片就让实验室花费了数百万美元。

卡内基梅隆大学研究员Devendra Chaplot表示，由各种硅谷大拿，其中包括Khosla Ventures和科技亿万富翁Reid Hoffman在内资助的DeepMind和OpenAI可以负担得起这些计算能力。但是，学术实验室和其他小型企业不能。对某些人来说，他们担心的是那些资金充足的实验室将主宰人工智能的未来。

但即使是大型实验室也可能没有将这些技术转移到现实世界的复杂性所需的计算能力，因为这可能需要更厉害的人工智能形式——人工智能需要学得更快。虽然机器现在可以在虚拟世界中赢得夺旗游戏，但让他们在夏令营中开放的场地上赢得游戏仍然无望，并且这将持续相当长一段时间。

关键字：人工智能机器人 3D 引用地址：AI 正赢得夺旗游戏，是否能成功转化到现实世界？

上一篇：带你全面了解如今的中国制造
下一篇：“智汇华云”-详细解读利用容器技术进行全流程软件交付

推荐阅读最新更新时间：2024-11-13 09:23

IMDT和Hailo携手推出边缘人工智能解决方案，旨在实时实现极致性能

双方的合作促成了尖端人工智能视觉解决方案，提高了效率、连通性和成本效益全球领先的尖端视觉和AI驱动型产品和系统供应商IMDT与高性能边缘装置人工智能处理器的领先供应商Hailo 今天宣布，双方建立了新的合作伙伴关系，将Hailo-8TM人工智能加速模块整合到IMDT的单板电脑（SBC）。该计算机是一款基于IMDT NXP iMX8M Plus SOM的即用型人工智能视觉系统。 IMDT imx8-E SBC与性能高达26TOPS的Hailo-8 AI处理器相结合，显著优于其他边缘处理器，具有高能效，可同时处理多串流和多模型，并提供一个功能齐全的系统，具有NXP主机处理器的能力和IMDTSBC的全面连通性。这

[工业控制]

IMDT和Hailo携手推出边缘<font color='red'>人工智能</font>解决方案，旨在实时实现极致性能

3D指纹门禁为新型门禁代言

科技的发展让很多事物变得智能精巧，门禁系统也在以用户的更高需求为中心不断地发展改良。新时代的门禁系统不只是传统的铁将军那么简单粗暴。而是逐渐成为安全放心、便捷智能的代名词。门禁系统作为一种防御系统，为用户牢牢守住大门，拦截不安全因素，创造一个安心的生活或学习环境。　　安全受重视门禁系统被普及　　门禁系统的普及反映了当代人们对安全和隐私的注重。各种门禁产品则出现在企业、小区以及各种不同场合当中。如果是银行等金融单位，门禁以安全为首要功能，门禁的设计精细且相对复杂;而一般的企业往往将门禁和考勤系统合为一体，使员工在进入公司的同时完成考勤程序;家居用户则更加看重安全与隐私，杜绝外来人员进出个人区域;而校园门禁与企业门禁

[安防电子]

高能低耗易部署，爱芯元智AX650N成Transformer最佳落地平台

近来，ChatGPT成为社会各界关注的焦点。从技术领域看，ChatGPT的爆发是深度学习领域演进、发展和突破的结果，其背后代表着Transformer结构下的大模型技术的飞速进展。因此，如何在端侧、边缘侧高效部署Transformer也成为用户选择平台的核心考量。 2023年3月，爱芯元智推出了第三代高算力、高能效比的SoC芯片——AX650N，依托其在高性能、高精度、易部署、低功耗等方面的优异表现，AX650N受到越来越多有大模型部署需求用户的青睐，并且先人一步成为Transformer端侧、边缘侧落地平台。 Transformer是当前各种大模型所采用的主要结构，而ChatGPT的火爆让人们逐渐意识到人工智能

[工业控制]

人工智能引发手机业新一轮革命

　　自iPhone诞生以来，智能手机就真正做到了有别于之前的功能手机，成为人们生活、工作离不开的“智能助手”。与此同时，智能手机也一直处于迭代式的发展之中，革命性的变化乃至能够让手机发展历程产生断代的创新，一直未曾发生。但是，伴随着人工智能 (AI)在手机的应用，下一个革命性的机会正在到来。这是《人民邮电》报记者在参加完荣耀手机联合极客公园举办的一场名为“AI手机元年下的变革与思考”公开课之后，最大的感触。下面就随手机便携小编一起来了解一下相关内容吧。　　迭代：智能手机发展的老模式　　“从iPhone诞生之后的数年，智能手机的发展都是一个迭代的过程，下一步有没有可能借助AI诞生革命性的产品，是当前智能手机产业发展的一个

[手机便携]

AI 成手机芯片厂商的新战场,高通、联发科、华为等各显神通

　　在过去的十年里，可以说手机经历了无数的创新，比如处理器从双核变为四核再变为八核，屏幕从小屏变为大屏再变为全面屏，解锁方式从滑动变为指纹识别再变为面部识别。为满足消费者的创新需求，智能手机品牌厂商和芯片供应商一直在绞尽脑汁寻求新的突破点。下面就随网络通信小编一起来了解一下相关内容吧。　　据 Digitimes 报道指出，为满足消费者的创新需求，手机芯片供应商势必将不断增加新应用、新功能及新设计，而现在人工智能(AI)应用已成为重要战区，包括苹果(Apple)、三星电子(Samsung Electronics)、华为、联发科、高通(Qualcomm)以及展讯等均将全面布局 AI ，以抢先获得商机。　　在人工智能的

[网络通信]

焊接机器人和焊缝跟踪系统的组成

　　各类传感器和智能控制方法极大促进了机器人在焊缝跟踪中的应用,不仅提高了焊缝跟踪的精度,同时提高了焊接效率和保证了焊接质量。简述了机器人焊缝跟踪系统的结构，详述了焊缝跟踪过程中各类传感器的工作原理及其特点；阐述了图像处理技术在机器人焊缝轨迹跟踪过程中的研究进展，并对图像的预处理、图像分割与边缘检测和特征提取等研究方法进行了分析。最后，总结了智能控制方法在焊缝跟踪中研究进展及不同形状的焊缝跟踪情况。　　随着工业及材料科学的发展，焊接自动化技术已成为一种不可缺少的金属热加工技术。焊接环境非常恶劣，实现焊缝跟踪的自动化可以降低焊接工作者的劳动强度，提高焊接质量。机器人及传感器技术和智能控制方法的迅速发展为焊缝跟踪

[机器人]

AI赋能3D打印产业，会带来哪些突破？

随着移动互联网、物联网以及 AI 技术的不断发展，很多产业因为这些先进的技术已经开始发生天翻地覆的变化。伴随着新型技术与产品的不断结合，智能安全、高效率、高品质的产品开始不断增多。 3D打印产业作为非常前沿的技术应用，由于物联网、AI技术出现，可以说让3D打印产业有了新的血液进入。在大家看来，由于物联网技术的应用让3D打印的质量、效率和安全性有了很大的提升。而随着AI技术的成熟应用，AI技术开始让3D打印技术变得更加有智商，可以说AI技术正在为3D打印设备进行“补脑”。变聪明的3D打印机自动化水平不断提高，屡创佳绩，不仅帮人类节省体力，更节省了脑力。AI技术可以让3D打印实现以机器制造机器，这也是新一轮制造业革命的助推剂

[嵌入式]

SpaceX启动一系列计划推出了坦克状的新式火箭回收机器人

据slara报道，美国太空探索技术公司SpaceX已经启动了对其东海岸无人回收船队的一系列重大升级计划，并推出了坦克状的新式火箭回收机器人。 SpaceX将其火箭回收机器人称为“Octagrabber”。从2017年开始，SpaceX已经在无人回收船OCISLY上使用回收机器人。虽然远未实现自动化，但Octagrabber帮助SpaceX的海上火箭回收团队将工人面临的风险降至最低，并为该公司提供了更大的灵活性，可以在不那么恶劣的海洋天气中尝试猎鹰助推器着陆。除了发现SpaceX前东海岸星际飞船工厂正在建造第二个Octagrabber机器人外，计划为无人回收船JRTI进行的其他升级依然保密。几个月来，这个火箭着陆平台

[机器人]

热门资源推荐
热门放大器推荐

小广播