DeepMind AI 的下一个挑战:像人类一样玩《Quake III Arena》

透过 AI 间的对战以及和人类的对战,AI 可以达到比人类还高的等级。

Andy Yang
Andy Yang
2018年07月4日, 晚上 07:01
自从 AlphaGo 突破了围棋这个人工智慧的门槛后,DeepMind 并没有就此满足,反而朝向更复杂的游戏前进,透过机器学习开发了可以像人类一样玩《Quake III Arena》的 AI。DeepMind 团队将重心放在「夺旗模式」上,并且让地图会在每场比试间随机进行变化。AI 不仅要能快速在随机地图中找到自己的位置并导航,还要懂得和队友合作、并且适应各种不同的敌方战术。

更进一步增加 AI 开发难度的,是游戏的目标只有一个,就是「赢」,而达成这个条件的方式有太多种,让 AI 很难判定到底是做了什么让「赢」或「输」更容易发生。每一个 AI 玩家还要颇外设定一些「动机」,像是跟随其他队友、或是夺取旗子等。除了让 AI 间「自行对抗」外,AI 专家们也让 AI 与人类对抗,学习人类的战术,结果发现 AI 比人类更能好好合作,并且还偷学了蹲点等招数。

从表现来看,自己和自己随机玩的 AI 到不了一般人类的水准,但加上足够多的动机的话,可以在 20 万场「训练」之后,到达接近人类「高手」的程度。如果是再加上了和人类间的对抗的话,则可以在大约 15 万场后超过人类好手,并且继续向上爬升。

就最直观来说,这样的 AI 在近期内可能可以有助于电竞团队练习、并发现新的战术;如果训练系统可以更通用化的话,或许可以产生出一些真正厉害的电脑对手来呢。
标签: ai, deepmind, gaming, multi-agent, personal computing, personalcomputing, Quake3Arena, training, video, videogames