ALphaGo再进化,新一代ALphaGo Zero诞生

发布者:婉如Chanel最新更新时间:2017-10-20 来源: 电子产品世界关键字:ALphaGo 手机看文章 扫描二维码
随时随地手机看文章

  据外媒报道,英国DeepMind团队的人工智能研究取得了新进展:他们开发出了新一代的围棋AI-ALphaGo Zero。使用了强化学习技术的ALphaGo Zero,棋力大幅度增长,可轻松击败曾经战胜柯洁、李世石的ALphaGo。下面就随网络通信小编一起来了解一下相关内容吧。

  战胜柯洁之后,ALphaGo可以说在围棋界里已是“独孤求败”的境界了,几乎没有人类是它的对手。但是这并不代表ALphaGo就已经对围棋领域的认知达到了顶峰。因此,ALphaGo想要再上一层楼追求围棋知识的上限,显然只有它自己能成为自己的老师。

  而在过去,AlphaGo都是使用业余和专业人类棋手的对局数据来进行训练。虽然使用人类棋手的数据可以让ALphaGo学习到人类的围棋技巧,但是人类专家的数据通常难以获得且很昂贵,加上人类并不是机器,难免会出现失误情况,失误产生的数据则可能降低ALphaGo的棋力。因此,ALphaGo Zero采用了强化学习技术,从随即对局开始,不依靠任何人类专家的对局数据或者人工监管,而是让其通过自我对弈来提升棋艺。

  那么到底什么是强化学习技术呢?简单地说,强化学习就是让AI从中学习到能够获得最大回报的策略。AlphaGo Zero的强化学习主要包含两个部分,蒙特卡洛树搜索算法与神经网络算法。在这两种算法中,神经网络算法可根据当前棋面形势给出落子方案,以及预测当前形势下哪一方的赢面较大;蒙特卡洛树搜索算法则可以看成是一个对于当前落子步法的评价和改进工具,它能够模拟出AlphaGo Zero将棋子落在哪些地方可以获得更高的胜率。假如AlphaGoZero的神经网络算法计算出的落子方案与蒙特卡洛树搜索算法输出的结果越接近,则胜率越大,即回报越高。因此,每落一颗子,AlphaGo Zero都要优化神经网络算法中的参数,使其计算出的落子方案更接近蒙特卡洛树搜索算法的结果,同时尽量减少胜者预测的偏差。


AlphaGo Zero的自我强化学习,图片源自Nature

  刚开始,AlphaGoZero的神经网络完全不懂围棋,只能盲目落子。但经历无数盘“左右互搏”般的对局后,AlphaGo Zero终于从从围棋菜鸟成长为了棋神般的存在。

  DeepMind团队表示,他们发现AlphaGo Zero自我对弈仅几十天,就掌握了人类几百年来来研究出来的围棋技术。由于整个对弈过程没有采用人类的数据,因此ALphaGo Zero的棋路独特,不再拘泥于人类现有的围棋理论,

  DeepMind团队还表示,这个项目不仅仅是为了获得对围棋更深的认识,AlphaGoZero向人们展示了即使不用人类的数据,人工智能也能够取得进步。最终这些技术进展应该被用于解决现实问题,如蛋白质折叠或者新材料设计。这将会增进人类的认知,从而改善每个人的生活。

    以上是关于网络通信中-ALphaGo再进化,新一代ALphaGo Zero诞生的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

关键字:ALphaGo 引用地址:ALphaGo再进化,新一代ALphaGo Zero诞生

上一篇:人工智能领域“新动向”早知道
下一篇:无人机加持5G 华为携中移动加速低空应用

推荐阅读最新更新时间:2024-05-07 17:40

未来五年人工智能将实现的五大突破
不论是可以和你对话的智能音箱,还是能够自己作画的虚拟艺术家;不论是能够帮助农民准确判断种植和施肥时间的农场管理系统,又或者是能够在演唱会现场快速识别罪犯的人脸识别程序,人工智能已经开始在各行各业得到广泛应用。 那么,未来的人工智能又有着怎样的发展趋势,对医疗、能源、制造、网络安全等行业,以及我们的工作、生活、生命健康又将产生怎样的影响?近期,奇点大学人工智能和机器人学项目负责人Neil Jacobstein提出了自己的预测。他认为,在未来五年(2019-2024),人工智能将实现五大突破。 这些突破包括:人工智能将完全改变我们对传统识别模式的认识;医生会越来越离不开机器学习;量子计算将大大提升药物的研发效率;人工智能设计系统将
[安防电子]
未来五年人工智能将实现的五大突破
AlphaGo增强版学会国际象棋和将棋 不到一天超越人类水平
  12月7日据国外媒体报道,谷歌旗下 人工智能 公司DeepMind一直都热衷于在棋盘上击败所有人类对手。虽然大部分时间关于 人工智能 技术的讨论都是在无人驾驶汽车等领域,但是作为一种属于未来的新技术,其实 人工智能 可以应对各种各样的挑战。虽然距离最终的目标还有很长的一段路,但是根据DeepMind公布的一项最新研究成果来看,人工智能至少已经走在了正确的道路上。下面就随网络通信小编一起来了解一下相关内容吧。   在一篇最新论文中我们看到了DeepMind开发的人工智能技术是如何在围棋以外的领域继续不断超越人类。这次的新技术AlphaZero在学习8个小时之后就成功的击败了之前“碾压”人类冠军的前任 AlphaGo 。同时又只
[网络通信]
人类失守德州扑克大战,我们还能跟人工智能比什么
在宾夕法尼亚州匹兹堡的 Rivers 赌场,卡耐基梅隆大学(CMU)开发的 Libratus   人工智能 系统击败人类顶级职业玩家。据官网介绍,此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金 。 如果你打算开始在网上玩扑克,可要三思了。在无限德扑比赛中(一对一、无限制投注的规则),人工智能击败世界最强的人类德州扑克玩家,这是人工智能历史上又一里程碑时刻。   比赛过程中,人类选手整体上从未领先过。进入比赛最后一天时,Lib
[嵌入式]
两个AlphaGo对战谁会赢?答案很简单
  2017年5月23日, AlphaGo 与柯洁在浙江乌镇进行对决。此前 AlphaGo 于2016年3月以4:1的比分战胜了韩国选手李世石,之后 AlphaGo 以Master作为ID在网络围棋平台上战胜了众多知名选手取得了60连胜的战绩,这其中也包括了要与其在乌镇对决的柯洁。下面就随网络通信小编一起来了解一下相关内容吧。 两个AlphaGo对战谁会赢?答案很简单   AlphaGo的强势崛起已经让部分人开始担心未来 人工智能 会代替甚至毁灭人类,著名的物理学家霍金也曾在公开场合多次提及过“ 人工智能 威胁论”。    霍金在GMIC大会上关于 人工智能 的讲话(图片来自互联网)   关于人工智能威胁论,早期
[网络通信]
小广播
最新网络通信文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved