东方头条  >   科技频道  >  正文
亲,暂时无法评论!

AlphaZero降临:8小时内拿下围棋、国际象棋、日本将棋!

(《麻省理工科技评论》中英文版APP现已上线,年度订阅用户每周直播科技英语讲堂,还有科技英语学习社区哦~)

自从DeepMind的AlphaGo在围棋赛场上一战成名之后,人类对AI的恐惧就突然出现于世。但自那以后,这家Google旗下的人工智能公司并没有停止前进的脚步,又推出了实力更强的AlphaGo Zero,而他们的远期目标是打造出通用的人工智能机器。虽然这一目标尚显遥远,但根据本周DeepMind科学家发表的最新的论文来看,他们已经走在了正确的道路上。

※ 论文地址:https://arxiv.org/pdf/1712.01815.pdf

在这篇论文中,DeepMind详细描述了AlphaGo Zero的“继承者”—— AlphaZero(注:之前刷屏的是 AlphaGo Zero,它做到的是不依赖任何人类知识,3天超越李世乭版本)。AlphaZero 首先经过 8 个小时的对世界顶级围棋棋谱的学习,就成功击败了与李世石对战的 AlphaGo v18;又经过了 4 个小时的训练,它又击败了世界顶级的国际象棋程序——Stockfish;紧接着,又是2个小时的训练之后,世界上最强的日本将棋程序Elmo又败在了它的手下。

看出来了吗?AlphaZero 或许已经有了些许迈向棋类通用 AI 的迹象!和AlphaGo Zero相比,AlphaZero的主要变化在于:

1、AlphaGo Zero优化时假定两种结果:输、赢。AlphaZero则有三种:输、赢、 僵持 。围棋每一步都可以有一个输赢,即谁的数量多,但是其他的很多棋在中间是没有输赢的,所以这样的设计使得AlphaZero从围棋跨向棋类领域。

2、AlphaZero能适应更为复杂的规则。围棋规则相对简单,规则具有旋转和反射不变形和对称性,所以AlphaZero的算法适应了将棋的规则意味着对于这样规则多变复杂的棋类的有效性。

3、在所有棋类中使用相同的超参数,这是泛化的表现,期间不需要针对特定棋做改变。

热门推荐

联系我们|eastday.com All Right Reserve 版权所有