Tensorflow怎样使糖果挤压虚拟玩家

发布时间：2022-03-25 08:53:50 所属栏目：要闻来源：互联网

导读：模拟人类游戏玩家使糖果粉碎开发人员King能够加快释放循环。 DeepMind的AlphaGo深度学习算法的演变是移动游戏开发人员King的启示，以使用Google的Tensorflow建立游戏播放器的模拟。 Alphago在2016年击败了World Champion Lee Sedol。为了模拟Go的古老游戏，A

　　模拟人类游戏玩家使糖果粉碎开发人员King能够加快释放循环。

　　DeepMind的AlphaGo深度学习算法的演变是移动游戏开发人员King的启示，以使用Google的Tensorflow建立游戏播放器的模拟。

　　Alphago在2016年击败了World Champion Lee Sedol。为了模拟Go的古老游戏，Alphago需要一遍又一遍地玩游戏，应用一种称为蒙特卡罗搜索的技术，它使用深度神经网络来“学习”是什么最佳的游戏移动。

　　亚历克斯Nodet，国王的AI工程师说：“我们曾经有过游戏玩家播放相同的水平20次并写一份报告。但这花了大约一个星期，我们希望能够每周发布15个新的水平。“

　　底线是：King越多可以测试，它可以释放越多。但是测试游戏游戏传统上是由人类完成的 - 它很慢。

　　为了解决这个问题，三年前的Nodet表示，三年前开始了一个研究项目，开发了使用Tensorflow建造的机器学习应用程序，可以测试使用机器人运行模拟的可行性，以便在扫描糖果粉碎的新程度才能玩。

　　了解需要解决的问题大约需要六个月，并使用受监督学习使用糖果粉碎游戏玩家的Tensorflow创建机器学习模型。Tensorflow有一个陡峭的学习流程，但深入了解框架工具的能力远远超过了深度学习。

　　“我们做了很多实验，让它更接近真正的球员并改变了建筑建造一个真正的球员，”Nodet说，并补充说公司需要经过大约20个模型的迭代来到达它的位置用于其预期目的。

　　国王团队使用云部署经理部署Google Kubernetes Engine工作负载，以创建数百名虚拟播放器，为机器学习模型培训。nodet说：“我们的缩放功能不够动态，谷歌Kubernetes Engine可以解决这个问题。在开发AI应用时，谷歌云机学习引擎也是一个很大的补充。“

　　由此产生的数据与云PUB / Sub，Google的公共云的消息中间件被送回国王的数据分析模块。这将创建反馈循环使MING能够优化其游戏的设计，以确保基于实体数据的基础，确保新的级别不太容易或太难。

　　“我们能够将我们的原型转换为人们想要使用的生产规模支持工具，”Nodet说。

　　根据Nodet，使用机器学习，缩减在Google的G-Cloud上，现在可以在仅需五分钟内完成对新糖果粉碎水平的反馈。

（编辑：开发网_开封站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!