Tensorflow怎样使糖果挤压虚拟玩家
发布时间:2022-03-25 08:53:50 所属栏目:要闻 来源:互联网
导读:模拟人类游戏玩家使糖果粉碎开发人员King能够加快释放循环。 DeepMind的AlphaGo深度学习算法的演变是移动游戏开发人员King的启示,以使用Google的Tensorflow建立游戏播放器的模拟。 Alphago在2016年击败了World Champion Lee Sedol。为了模拟Go的古老游戏,A
模拟人类游戏玩家使糖果粉碎开发人员King能够加快释放循环。 DeepMind的AlphaGo深度学习算法的演变是移动游戏开发人员King的启示,以使用Google的Tensorflow建立游戏播放器的模拟。 Alphago在2016年击败了World Champion Lee Sedol。为了模拟Go的古老游戏,Alphago需要一遍又一遍地玩游戏,应用一种称为蒙特卡罗搜索的技术,它使用深度神经网络来“学习”是什么最佳的游戏移动。 亚历克斯Nodet,国王的AI工程师说:“我们曾经有过游戏玩家播放相同的水平20次并写一份报告。但这花了大约一个星期,我们希望能够每周发布15个新的水平。“ 底线是:King越多可以测试,它可以释放越多。但是测试游戏游戏传统上是由人类完成的 - 它很慢。 为了解决这个问题,三年前的Nodet表示,三年前开始了一个研究项目,开发了使用Tensorflow建造的机器学习应用程序,可以测试使用机器人运行模拟的可行性,以便在扫描糖果粉碎的新程度才能玩。 了解需要解决的问题大约需要六个月,并使用受监督学习使用糖果粉碎游戏玩家的Tensorflow创建机器学习模型。Tensorflow有一个陡峭的学习流程,但深入了解框架工具的能力远远超过了深度学习。 “我们做了很多实验,让它更接近真正的球员并改变了建筑建造一个真正的球员,”Nodet说,并补充说公司需要经过大约20个模型的迭代来到达它的位置用于其预期目的。 国王团队使用云部署经理部署Google Kubernetes Engine工作负载,以创建数百名虚拟播放器,为机器学习模型培训。nodet说:“我们的缩放功能不够动态,谷歌Kubernetes Engine可以解决这个问题。在开发AI应用时,谷歌云机学习引擎也是一个很大的补充。“ 由此产生的数据与云PUB / Sub,Google的公共云的消息中间件被送回国王的数据分析模块。这将创建反馈循环使MING能够优化其游戏的设计,以确保基于实体数据的基础,确保新的级别不太容易或太难。 “我们能够将我们的原型转换为人们想要使用的生产规模支持工具,”Nodet说。 根据Nodet,使用机器学习,缩减在Google的G-Cloud上,现在可以在仅需五分钟内完成对新糖果粉碎水平的反馈。 (编辑:开发网_开封站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |