Will Knight:《星际争霸》是怎样开展学习和研究的?
Oriol Vinyals:我们现在其实在做一个简化版,还在研究整个网络背后的一些基本的原理,我也在想把它写成论文,介绍在测试的过程有哪些是比较容易的,哪些是比较难的。
Will Knight:你们为什么选择《星际争霸》?大家都知道《星际争霸》有很大的用户群,而且很难。
Oriol Vinyals:因为在我自己还是伯克利大学学生的时候,就玩过《星际争霸》。我和很多伯克利分校的同事在2010年开始做这个研究,当时我们在想的是如何争霸、如何打败敌方。《星际争霸》是我们应用AI技术的一个出发点
在这个过程中,我们看到了很多挑战,因此我们需要很多创新的算法。需要更多的研究人员参与进来,设计一些新的问题和任务,看能否完成。
Will Knight:是否能够将AI在《星际争霸》中的技术应用到现实生活中,
Oriol Vinyals:现实世界缺少完成加强学习的完美信息。比如谷歌,有很多人都在使用谷歌,它没有周围人的信息而是依靠着巨大的信息进行预测。我们是借助了用户的力量。现在我们考虑的是怎么样借助应用去处理数据、加工数据。
其实我们在设计一个这样的操作系统,它不会为所有的用户所用,但是会帮助我们的用户去减少很多能耗。
Will Knight:之前有Alpha Go1.0,现在又有2.0了,在1.0中,它已经获胜了。新的一代,会有更多优势,在《星际争霸》中是否也有这样的迭代和更新呢?你们有什么战略呢?
Oriol Vinyals:《星际争霸》的应用在我看来是一个新的事物。我们为游戏过程设计了不同的指令,不同的模式和模板,这使得整个玩《星际争霸》的过程变得独一无二。这种指令会越来越高效。通过指令,我们基本上可以超越之前的算法,我觉得这也是我们的一个亮点。
说到战略,我们会训练整个系统,收集整个星际争霸玩家的行为进行分析。比如哪些走法可能没有优势,哪些玩法过于简单。现在我们会为玩家提供一些打《星际争霸》最简单的走法。
歡迎光臨 比思論壇 (http://bb-cdn.space/) | Powered by Discuz! X2.5 |