基于增强学习的80分游戏AI设计与开发 摘 要 自从李世石被alphago战胜的消息被传开,人工智能这个话题已经越来越进入人们的视野。而如何让机器人具有‘智能’,且甚至能在某些领域超越人类,这就不得不用到一些算法,其中当下最热门的便是机器学习算法。如何利用好机器学习算法,构造一个合适和神经网络,将机器训练的越来越‘智能’是当下要解决的主要问题。 本文以中国特色一种扑克游戏‘80分’为载体,将围棋alpha go所运用的机器学习算法进行转接于其上,以测试其效果。工作的主要难点在于:第一,‘80分’是一款4人游戏,这比原先的2人围棋游戏要考虑的更多,且参加游戏的4人两两合作互相对抗,这就更需要机器达到一定的智能水平;第二,‘80’分游戏的开局与围棋不同,围棋的开局是固定的,而‘80分’的玩家则会被分配到随机的扑克牌,其分配方案千变万化不可预测;第三,由于‘80分’游戏与围棋的差别,如何设计一个新的神经网络系统,以及如何构造一款适合于研发AI的‘80分’游戏软件,这都是我们需要解决的问题。 论文从当下的时代条件出发,介绍了人工智能的现状和发展情况。然后,详细介绍了BP算法和LeNet5模型算法。接着,论文仔细描述系统的实现,特别是具体介绍了神经网络部分的设计与实现,整个神经网络系统和试验结果做出了总结,说明了结果的不足和一些需要改进的地方。 关键词:人工智能,机器学习 目 录 第一章 绪论 1 1.1 引言 1 1.2 论文组织结构 1 第二章 ‘80分’游戏规则介绍与特点概述 3 2.1 “80分”游戏的规则 3 2.2 牌的分类 3 2.3 玩家策略 4 2.4 本章小结 4 第三章 核心算法介绍与讲解 5 3.1 BP算法 5 3.2 LeNet5模型算法 6 第四章 系统输入与框架设计 9 4.1 系统输入实例 9 4.2 系统的框架设计 9 第五章 系统输出实例与参数介绍以及有效性验证 11 5.1 系统输出实例与参数介绍 11 5.2 系统输出有效性验证 12 第六章 总结与改进 15 6.1 论文总结 15 6.2 不足之处 15 参考文献 16 |
基于增强学习的80分游戏AI设计与开发
更新时间:2019-01-12
下一篇:网上图书商城系统