不和你们玩了!人类玩家太“菜”,AI开始和AI玩游戏
编辑:admin 日期:2019-04-11 10:22:38 / 人气:
在那之后他们的 AI 拓展到了多人合作,仅仅是几个月的训练就已经拥有了 5V5 情况下打败人类准职业选手的水平,平均每局游戏只要 30 分钟,可以说是干脆利落。
不过在之后挑战真正职业选手时,OpenAI 落败了,也算是人类为自己保存了最后一丝颜面。( 比赛详情点击这里→五个AI也打不过中国人!)
距离这场比赛已经过去半年多了,这期间 OpenAI 都没什么大动静,但是在今年三月份,他们推出了一个叫做 Neural MMO 的大型多人在线游戏。
你说这公司不是研究 AI 的吗?怎么转行做游戏去了?还做得那么糙?
这个游戏其实并不是做给人类玩的,而是专门做给 AI 玩的,所有游戏中的 “ 玩家 ” 都是 AI 。
在游戏设定中,整个地图上的资源是有限的,分为石头、草地、熔岩、灌木等等种类,也有食物的存在, AI 则被分为不同种族,根据种族不同有着近战、远程、法术攻击三种模式,整个地图最多容纳 100 个 AI 同时游戏。
它们在这个世界中的目标只有一个——活到最后。
这样的设定其实是非常残酷的,AI 必须合理地选择适合自己发展的环境,以及与其他 AI 争夺有限的食物资源。
在整个游戏过程中,OpenAI 的工作人员会以上帝视角观察整个地图的情况,并且对 AI 的行为进行记录。
值得注意的是,和人类玩家不一样,在 AI 的 “ 认知 ” 中,他们是不知道一局游戏结束后,是可以 “ 重生 ” 的。
人类玩家玩游戏,一局失败了大不了马上再开一局,而 AI 则是认为自己只有一次生命,会根据自己的逻辑坚定地执行 “ 活到最后 ” 的指令。
工作人员发现,大部分的 AI 都会在这样的情况下选择找个地方 “ 苟活 ” ,找个安静的角落过着与( wei )世( suo )无( fa )争( yu )的生活。
当进入游戏的 AI 变多后,AI 们也会做出决策,自发地开拓地图的角落,避免争端,而每一个 AI 做出的决策,都会在一定程度上影响到别的 AI 的决策选择,情况可以说是瞬息万变。
说白了,这个网游就是一个 AI 的 “ 斗兽场 ” ,或者说是在 “ 养蛊 ” ,最后活下来的 AI 的适应性和学习能力一定是最强的那个。
在长久的生物进化过程中,现在活下来的动物们都各自进化出了各自的特征,人类是其中的佼佼者,进化出了对自己而言最适合生活在这个世界的特征以及生活方式。而以 “ 人类 ” 为最终目标的 AI ,进化的方向自然也是这样,更多的是 “ 思考方式 ” 上的进化。
尽管 Neural MMO 已经尽可能地模拟了真实环境,但是由于素材限制等原因,还是有很大程度的简化,所以 AI 的进化程度还是有一定的局限性。
实际上这样的 AI 训练方式相对以往已经有了非常大的进步了。
早些年的 AI 训练都是以单机游戏为主,让 AI 自己发现每一步该如何操作,并且最终选出最优解。
今年一月份,游戏引擎开发商 Unity 也推出过一款专门给 AI 挑战的游戏,叫《 Obstacle Tower 》,它设置了许多谜题,用于测试 AI 的视觉、控制力等各项能力,一共有 100 层。
Unity 还专门设置了 1 万美元的奖金,邀请各路 AI 开发者前来挑战,谁能最早通过就可以获得 1 万美元以及机器学习相关的奖励。
由此可以看出,随着时间在进化的不止是 AI 的能力,训练 AI 的方式同样在进步着。
从最开始的单机游戏中寻找游戏中的固定步骤,到后来的 Obstacle Tower 考察 AI 的视觉、操作等能力,再到 Neural MMO 中模拟生存环境。。。
也许有一天,当技术的进步可以让我们实现真正的 “ 虚拟现实 ” 时,AI 也会进化出人类的思维方式吧。
内容搜索 Related Stories
推荐内容 Recommended
- 小小玩具展现时代变迁 从“玻璃球儿”到“平板电脑”08-31
- 英语早教玩具市场具备潜力08-30
- 长垣男孩游泳时脚趾被玩具"咬住" 消防破拆成功解救08-27
- 新款玩具重在“体验”08-27
- 网上标明正版授权的玩具 其实是盗版的08-21
- 济南市历城区教育局钢城幼儿园教育集团玩具采购项目公开招标公告08-12