当前位置:主页 > 计算机软件论文 >

基于增强学习的80分游戏AI设计与开发

更新时间:2019-01-12
阅享价格100元 资料包括:原始论文 点击这里给我发消息QQ在线咨询
文档格式:doc/docx 全文字数:7100 温馨提示
以下仅列出文章摘要、提纲简介,如需获取全文阅读权限,或原创定制、长期合作,请随时联系。
微信QQ:312050216 点击这里给我发消息
扫一扫 扫一扫
基于增强学习的80分游戏AI设计与开发

摘  要

       自从李世石被alphago战胜的消息被传开,人工智能这个话题已经越来越进入人们的视野。而如何让机器人具有‘智能’,且甚至能在某些领域超越人类,这就不得不用到一些算法,其中当下最热门的便是机器学习算法。如何利用好机器学习算法,构造一个合适和神经网络,将机器训练的越来越‘智能’是当下要解决的主要问题。
本文以中国特色一种扑克游戏‘80分’为载体,将围棋alpha go所运用的机器学习算法进行转接于其上,以测试其效果。工作的主要难点在于:第一,‘80分’是一款4人游戏,这比原先的2人围棋游戏要考虑的更多,且参加游戏的4人两两合作互相对抗,这就更需要机器达到一定的智能水平;第二,‘80’分游戏的开局与围棋不同,围棋的开局是固定的,而‘80分’的玩家则会被分配到随机的扑克牌,其分配方案千变万化不可预测;第三,由于‘80分’游戏与围棋的差别,如何设计一个新的神经网络系统,以及如何构造一款适合于研发AI的‘80分’游戏软件,这都是我们需要解决的问题。
       论文从当下的时代条件出发,介绍了人工智能的现状和发展情况。然后,详细介绍了BP算法和LeNet5模型算法。接着,论文仔细描述系统的实现,特别是具体介绍了神经网络部分的设计与实现,整个神经网络系统和试验结果做出了总结,说明了结果的不足和一些需要改进的地方。 
关键词:人工智能,机器学习

目 录

第一章 绪论 1
1.1 引言 1
1.2 论文组织结构 1
第二章 ‘80分’游戏规则介绍与特点概述 3
2.1 “80分”游戏的规则 3
2.2 牌的分类 3
2.3 玩家策略 4
2.4 本章小结 4
第三章 核心算法介绍与讲解 5
3.1 BP算法 5
3.2 LeNet5模型算法 6
第四章 系统输入与框架设计 9
4.1 系统输入实例 9
4.2 系统的框架设计 9
第五章 系统输出实例与参数介绍以及有效性验证 11
5.1 系统输出实例与参数介绍 11
5.2 系统输出有效性验证 12
第六章 总结与改进 15
6.1 论文总结 15
6.2 不足之处 15
参考文献 16