[程序设计]-基于人工智能博弈树,极大极小(Minimax)搜索算法并使用Alpha-Beta剪枝算法优化实现的可人机博弈的AI智能五子棋游戏。

news2024/10/5 15:38:32

绪论-五子棋的特点与规则

五子棋是两方之间进行的竞技活动,专用棋盘为15*15,五连子的方向为横、竖、斜;任一方在棋盘上形成横向、竖向、斜向的连续的相同颜色的五个(含五个以上)时即为该方胜利;在棋盘上以对局双方均不可能形成五连为和棋。黑白双方依次落子,由黑方先下,由于先下一方在局面上占优,所以五子棋规则分为禁手和无禁手两种。

禁手规则:禁手是针对先行的黑棋而言,以限制黑棋的先行优势为目的。对局中如果黑棋违反禁手规则将被判负。以中国五子棋竞赛规则为例,有三三禁手(黑棋一子落下时同时形成两个或两个以上的活三,此子必须为两个活三共同的构成子)、四四禁手(黑棋一子落下同时形成两个以上的冲四或活四)、长连禁手(黑棋一子落下形成一个或一个以上的长连)。无禁手指不对黑棋的先行优势做任何限制。

表4.1.1 常见的棋盘术语

概念

概念描述

阳线

直线,棋盘上可见的横纵直线。

阴线

斜线,由交叉点构成的与阳线成45°夹角的隐形斜线。

长连

五枚以上同色棋子在一条阳线或阴线上相邻成一排。

活四

有两个点可以成五的四。

冲四

只有一个点可以成五的四。

死四

不能成五的四。

活三

再走一着可以形成活四的三。

眠三

再走一着可以形成冲四的三。

死三

不能成五的三。


 程序设计运行流程图

为实现以上程序的正常运行,程序设计开发出了,初始化模块,图形界面模块,游戏规则模块,AI函数处理模块等。这些模块的具体设计将在下一章内详细介绍。

AI五子棋运行流程图

 AI算法的具体实现

创建minimax的节点

搜索时的一个节点,需要创建一个minimax的节点,节点需要考虑的要素有:

    param game:                 游戏内容。是Game类的一个对象
    param ope:                    这一步的操作是什么
    param depth:                 当前节点的深度
    param alpha:                 这个节点初始的alpha值
    param beta:                   这个节点初始的beta值
    param force_score:       是否必须算出一个分数
    param player_first:        是否玩家先出

对节点的评价分析

结合上文对于五子棋对弈的特点与规则的介绍,我们可以构造出一个合适的评价函数,通过评价函数估值AI下载棋盘上的每一步的价值,从而AI可以选择出每个对弈回合中最有利于AI的落子位置。

计算这个节点的分数。对AI越有利则分数越高,反之分数越低。

      如果能够连成五子,则记为100分

      判断玩家和电脑的四子的数目(需要保证:不是已经被堵死的四子)

      如果能够连成活四,或连成双四,则记为90分

      如果能够连成四三,则记为80分

      如果能够连成四子,则记为70分

      如果能够连成双三,则记为60分

      如果能够连成单活三,则记为50分

      其他情况。按照棋子的分布来计分(根据这个棋子距离棋盘中心的距离,以及这个棋子周围8格棋子的个数来评分)

如代码所示的为如果能够连成活四,或连成双四,则记为90分的节点评价的设计情况。


实现搜索算法的优化

按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果。
 param cur_node_dx: 当前节点的索引值
 param ope_hist: 假象的历史状态列表
 param max_depth: 最大允许的深度。

优化算法的主要设想


1.首先确认什么地方可以落子。

落子的条件是:这个格子必须为空,周围8格内必须有至少一个棋子。
2.然后对每一个可以落子的格子进行搜索


2.1 创建一个子节点,并计算这个子节点的分数
        a.对于非最终层的节点,不急于立即算出分数,
        b.把这个节点插入到搜索树中,
        c.将这个新节点记录为当前节点的子节点,
        d.记录每个节点下一步的动作。


2.2根据子节点的情况,进行父节点的后续操作
        a.子节点有具体分数的情况下,就不用再进行更深层的迭代了
        b.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值
        c.假想中电脑走的,因此需要让分数尽量大,且应该修改alpha值
        d.子节点还没有具体分数的情况下,应该以这个子节点为下一层的根节点,进行递归,之后再进行计算


2.3根据递归后计算的结果,计算这个节点的分数
        f.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值
        g.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值


3.alpha-beta剪枝实现搜索优化


程序运行的模块代码调用过程

程序运行主要由五个模块组成,分别为:初始化模块、图形界面模块、游戏规则界面、AI函数处理,主函数模块。

初始化模块

初始化模块:对应程序中conner_widget.py,主要就是做一个程序的运行背景,对棋盘的初始化。

图形界面模块

图形界面模块是运行中的窗口显示,主要功能函数及解释如下:

def run_with_exc(f): 游戏运行出现错误时,用messagebox把错误信息显示出来

        init_ui()  # 初始化游戏界面

        self.g = Gomoku()  # 初始化游戏内容

        self.res = 0  # 记录那边获得了胜利

       self.operate_status = 0 

# 游戏操作状态。0为游戏中(可操作),1为游戏结束闪烁过程中(不可操作)



def init_ui(self): 初始化游戏界面

  1. 确定游戏界面的标题,大小和背景颜色

        self.setPalette(palette)

2. 开启鼠标位置的追踪。并在鼠标位置移动时,使用特殊符号标记当前的位置

        self.setMouseTracking(True)

  3. 鼠标位置移动时,对鼠标位置的特殊标记

        self.corner_widget = CornerWidget(self)

        self.corner_widget.repaint()

        self.corner_widget.hide()

  4. 游戏结束时闪烁的定时器

        self.end_timer = QTimer(self)

        self.end_timer.timeout.connect(self.end_flash)

        self.flash_cnt = 0  # 游戏结束之前闪烁了多少次

        self.flash_pieces = ((-1, -1), )  # 哪些棋子需要闪烁

   5. 显示初始化的游戏界面

        self.show()



def paintEvent(self, e):绘制游戏内容

def draw_map():""绘制棋盘"""棋盘的颜色为黑色(绘制横线,竖线

def draw_pieces(): 绘制棋子



def mouseMoveEvent(self, e):

     1. 首先判断鼠标位置对应棋盘中的哪一个格子

     2. 然后判断鼠标位置较前一时刻是否发生了变化

     3. 最后根据鼠标位置的变化,绘制特殊标记


def mousePressEvent(self, e):根据鼠标的动作,确定落子位置

def end_flash(self) 游戏结束时的闪烁操作

def game_restart(self, res):游戏出现开始

游戏规则模块

游戏规则模块主要就是对游戏规则的说明:

class Gomoku:

def __init__(self):

        self.g_map = [[0 for y in range(15)] for x in range(15)]  # 当前的棋盘

        self.cur_step = 0  # 步数

        self.max_search_steps = 3  # 最远搜索2回合之后

def move_1step(self, input_by_window=False, pos_x=None, pos_y=None):玩家落子

        :param input_by_window: 是否从图形界面输入

        :param pos_x: 从图形界面输入时,输入的x坐标为多少

        :param pos_y: 从图形界面输入时,输入的y坐标为多少

def game_result(self, show=False):

判断游戏的结局。0为游戏进行中,1为玩家获胜,2为电脑获胜,3为平局。
主要用于判断是否横向连续五子,判断是否纵向连续五子,判断是否有左上-右下的连续五子,判断是否有右上-左下的连续五子,判断是否为平局。

def ai_move_1step(self):""电脑落子""

def ai_play_1step_by_cpp(self):判断下一步的操作

def show(self, res):""显示游戏内容""

def play(self):用户玩游戏

AI函数处理模块

AI函数处理模块:用到Alpha-Beta算法。

class Node:AI搜索时的一个节点

def __init__(self, game, ope, depth, alpha, beta, force_score, player_first):

        创建一个minimax的节点,

:param game: 游戏内容。是Game类的一个对象,

:param ope: 这一步的操作是什么,

:param depth: 当前节点的深度,

:param alpha: 这个节点初始的alpha值,

:param beta: 这个节点初始的beta值,

:param force_score: 是否必须算出一个分数,

:param player_first: 是否玩家先出。

     def calc_score(self):

        计算这个节点的分数。对AI越有利则分数越高,反之分数越低。

class AI1Step:落棋步骤

    def __init__(self, init_game, init_depth, player_first):

        决定AI这一步走什么地方,

:param init_game: 初始的游戏地图,

:param init_depth: 初始的深度,

:param player_first: 玩家是否先出。

    def search(self, cur_node_dx, ope_hist, max_depth):

        按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果,

:param cur_node_dx: 当前节点的索引值,

:param ope_hist: 假象的历史状态列表,

:param max_depth: 最大允许的深.

主函数模块

主函数模块作为程序的入口,进行程序的运行。

def main():

    app = QApplication(sys.argv)

    ex = GomokuWindow()

    sys.exit(app.exec_())

if __name__ == '__main__':

    main()


程序的运行情况

整体运行情况不错,反应比较灵敏,但在后期由于棋子越来越多,程序对棋子所做的选择就越来越多,运行速度就会变慢。而在运行过程中也有极小的概率程序会异常中断,目前分析可能为内存占用过多触发了程序设置的内存限制而导致的。黑白某一方连成五子即为获胜,当棋子落满棋盘的时候会默认为平局。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/137180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Intel OneApi Developer Tools

“英特尔OneApi开发人员工具”是一组工具和库,用于为Internet发布的各种处理建筑开发高速应用程序。oneAPI是一个完全开放的编写程序模型,支持具有不同架构的各种制造商。使用此工具,其他开发人员需要为每个架构师使用特定的代码,…

【小程序】视图与逻辑

文章目录页面导航声明式导航编程式导航导航传参页面事件下拉刷新事件上拉触底事件生命周期WXS 脚本wxs 和 JavaScript 的关系基础语法页面导航 页面导航指的是页面之间的相互跳转。例如&#xff0c;浏览器中实现页面导航的方式有如下两种&#xff1a; ① <a> 链接② lo…

前端工程师leetcode算法面试必备-二叉树的构造和遍历

一、前言 上一篇中介绍了如何采用 DFS 和 BFS 的搜索思想去实现二叉树的前序遍历、中序遍历、后序遍历以及分层遍历。 这一节主要介绍 Medium 难度中比较常见的一种题型&#xff1a;根据各种遍历构造二叉树。 二、1008. 先序遍历构造二叉树 返回与给定先序遍历 preorder 相匹…

2022阅读数据分析报告

零、前言 晃晃悠悠,又至年尾。翻阅新的书籍五十有余,得到读书和樊登讲书,累计或许在千余小时,或跑步,或骑行,或徒步,偶或地铁,都做耳旁音。回首年初扶起的flag,细思存量不存质。暂且延续2021年的阅读记录方式1,简单可视化本年阅读数据,收尾第二年的阅读小结。 图1 年…

WeNet开源社区介绍

本文是由张彬彬在第二届SH语音技术研讨会和第七届Kaldi技术交流会上对WeNet开源社区的一些工作上的整理&#xff0c;内容涵盖了 WeNet 的最新进展、新项目WeKws&#xff0c;WeSpeeker和WeTextProcessing的介绍&#xff0c;以及去年发布的两个数据集Opencpop和WenetSpeech在今年…

11矩阵空间、秩1矩阵

矩阵空间 知识概要 ​ 从矩阵空 间谈起&#xff0c;介绍矩阵空间的维数&#xff0c;基等问题。渗透一些微分方程与线性代数之间的 联系&#xff0c;并介绍秩为 1 的矩阵特点。 矩阵空间 对角阵D不是很理解。 &#xff08;1&#xff09;基与维数 再看对角阵 D&#xff0c;明…

Hudi学习03 -- Spark操作hudi(Spark-shell 和 PySpark)

文章目录Spark环境准备Spark-shell 方式启动命令&#xff0c;需要显示指定一些参数插入数据查询数据时间旅行&#xff08;Time Travel Query&#xff09;更新数据增量查询&#xff08;Incremental query&#xff09;删除数据&#xff08;Delete Data&#xff09;覆盖分区数据&a…

阴道菌群——贯穿女性一生

阴道微生物组是一个复杂而动态的微生态系统&#xff0c;在女性月经周期和女性的一生中不断发生波动。 在过去几年中&#xff0c;对阴道微生物群关注随着测序技术的发展和应用逐渐广泛和突出&#xff0c;有关以往传统正常和异常阴道微生物组的知识也发生了变化。培养技术可能不再…

Bandit算法学习[网站优化]01——Multiarmed Bandit 算法引入

Bandit算法学习[网站优化]01——Multiarmed Bandit 算法引入 参考资料 White J. Bandit algorithms for website optimization[M]. " O’Reilly Media, Inc.", 2013.https://github.com/johnmyleswhite/BanditsBookeasy-rl 一、探索与利用&#xff08;exploration…

Next.js i18n国际化实现方案(支持ReactNode类型、可传参)

前言 抛开Next.js框架不谈&#xff0c;想必其他项目也经常会遇到国际化方案&#xff0c;大概逻辑都是差不多的&#xff0c;只是说这次本人碰巧在Next上的项目有这样的需求&#xff0c;并记录下来。 实现思路&#xff1a; 其实不从代码角度上讲的话&#xff0c;无非是引入一个…

【王道操作系统】3.1.6 分页存储(页号、页偏移量等)

分页存储(页号、页偏移量等) 文章目录分页存储(页号、页偏移量等)1.为什么学习分页存储2.基本分页存储管理的思想3.分页存储管理的重要概念4.如何实现地址的转换4.1 如何计算页号和页偏移量4.2 分页存储的逻辑结构4.3 如何知道页面在内存中的起始地址1.为什么学习分页存储 2.基…

Qt扫盲-QSS语法概述

QSS语法概述一、语法规则二、选择器类型三、子控件四、伪态五、冲突解决六、样式层叠七、样式继承八、含命名空间样式设置九、QObject 属性设置概述&#xff1a;QSS也叫Qt样式表&#xff0c;Qt样式表术语和语法规则几乎与HTML CSS的术语和语法规则相同。如果已经了解CSS&#x…

【Vue2+Element ui通用后台】整体布局、数据展示、axios封装

文章目录Home组件表格Axios封装Home组件 我们新建 Home 组件来展示右侧的内容 整体布局我们使用layout布局&#xff0c;通过基础的 24 分栏&#xff0c;迅速简便地创建布局。由于左侧占比较小&#xff0c;我们分为 8 和 16 即可 然后每个卡片样式的部分&#xff0c;我们使用…

flask session机制

信息收集 主页是一个登陆界面其他按钮点击不了&#xff0c;源代码也没什么东西。 除了admin用户不能直接登陆&#xff0c;其他用户都可以。 打开以后是一个文件上传&#xff0c;然后根据提示只能上传zip文件&#xff0c;我们随便上传一个 我在zip文件里面写了一个/etc/passw…

prometheus监控报警部署Alertmanager

Prometheus将告警分为两个部分&#xff1a;Prometheus 和 Alertmanager。其中Prometheus配置告警触发规则&#xff0c;对指标进行监控和计算&#xff0c;将再将告警信息发送到Alertmanager中。Alertmanager对告警进行管理&#xff0c;比如合并抑制等操作。 wget https://github…

10.移动端笔记-响应式布局

1.响应式开发 原理&#xff1a;使用媒体查询针对不同宽度的设备进行布局和样式设置&#xff0c;从而适配不同的设备 2.响应式布局容器 响应式需要一个父级做为布局容器&#xff0c;配合子级元素实现变化效果 原理&#xff1a;在不同屏幕下&#xff0c;通过媒体查询改变这个…

HAProxy的安装

1、将HAProxy上传到opt目录下 2、 解压到/usr/local/src tar -xvf haproxy-1.5.18.tar.gz -C /usr/local/src 3、进入解压后的目录&#xff0c;查看内核版本&#xff0c;进行编译 cd /usr/local/src/haproxy-1.5.18 uname -r make TARGETlinux310 PREFIX/usr/local/haproxy …

Keil MDK 配置详解与调试技术

工程配置介绍① 通用配置选项&#xff1b;② 操作系统选项&#xff1b;③ 勾选后可以减小镜像尺寸&#xff0c;加快运行速度&#xff1b;④ 浮点配置&#xff1b;⑤ 加载简要配置&#xff0c;分散加载情况需要配置&#xff1b;编译器输出选项&#xff1b;可执行…

今年你拿到了几个月的年终奖?

近期听到最多的三个消息&#xff1a;阳了 、 裁员 、 年终奖。 今年无疑是非常艰难的一年&#xff0c;无论国内还是国外裁员貌似从年初到年末从未停止过&#xff0c;加上疫情放开之后&#xff0c;大部分人都加入了羊群的行列&#xff0c;让我们的生活雪上加霜。 腾讯今年也陆…

结构化分析方法

目录 1.概述 2.数据流图 3.结构图 4.一个例子 4.1.需求 4.2.数据流图 4.3.结构图 5.辅助工具 5.1.数据字典 5.2.加工说明 1.概述 结构化方法是世界上第一个软件开发方法学&#xff0c;用来指导从需求分析、到设计开发各个阶段该怎么样做&#xff0c;采用什么样的方法…