谷歌DeepMind新进展,《雷神之锤3》获胜率已超人类

青亭网( ID:qingtinwang )--链接科技前沿,服务商业创新

上周,青亭网曾经报道过,OpenAI的智能机器人玩Dota 2打败了人类玩家。而本周AI队又加一分,谷歌子公司DeepMind的科研团队训练出了能在《雷神之锤3:战场》中的 “夺旗” 游戏中打败人类玩家的AI机器人。

与AI玩游戏的先例相同,DeepMind科研团队面临的挑战是利用不完整信息训练AI机器人玩复杂的3D游戏,为此,他们使用了一种逐渐成为主流的AI强化训练法,也就是进行大量的反复训练。而科研人员也没有指导AI机器人如何玩游戏,只是放任机器人对打,直到机器人算出获胜的策略,也就是说,水平相当的AI机器人会相互PK。

DeepMind在此基础上又增加了难度,训练了30种不同的AI机器人,来提供多样的玩法。而训练出这种AI,需要玩将近50万场游戏,每场游戏五分钟。DhQZpKvXcAA3NDK

这样听起来简单的训练方法,居然能让机器人自发学会复杂的玩法,真的不可思议。DeepMind的AI机器人不仅学习了“夺旗”的基本规则(从敌方基地夺旗,然后赶在对方夺你旗之前回到大本营),还学会了守旗,在敌方阵营扎营,跟随队友gank。

DeepMind为了继续给AI机器人的增加挑战,将每场游戏都建立在全新、且需要探索的非全开地图。

与OpenAI的Dota 2机器人不同,DeepMind公司的机器人并未接触到《雷神之锤3》的原始数据资料(显示与敌人距离和血量等的数字信息),而是模仿人类,通过直接观察屏幕上的信息来学习。当然,这并不能说明DeepMind的机器人面临的挑战要大于玩Dota 2的AI,毕竟Dota 2整体还是比《雷神之锤3》要复杂得多。

最后,DeepMind举办了一场比赛,来测试AI机器人的能力。比赛中,有二人对抗二AI,也有AI与人类混搭的二人组PK。两个AI组成的队伍最成功,有着74%的获胜几率。而普通人类玩家的获胜几率只有43%,玩的好的人获胜几率有52%,这也就证明了AI机器人比人类更会玩。

 

c78e16bce142410a9feb53aeb21ba776

值得注意的是,一组玩家中机器人越多,结果反而越不好。四个DeepMind机器人队伍的或胜率是65%,也就是说AI机器人的团队合作还有待提高。

这样的研究,其实一直都不是为了训练AI机器人在游戏中打败人类玩家,而是寻求新办法教育机器人合作在环境中生存,也就是训练集体智能(总的来说,这也是人类成功的诀窍)。

笔者认为,AI在“夺旗”中的表现,预示了将来还会有更大的成功。

参考:The Verge

更多精彩内容,关注青亭网微信号(ID:qingtinwang),或者来微博@青亭网与我们互动!转载请注明版权和原文链接!
青亭网

微信扫码关注青亭网

青亭网

青亭 | 前沿科技交流群01

责任编辑:小新
分享到QQ 分享到微信
切换注册

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册