RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1425587
Accepted
Максим Фисман
Максим Фисман
Asked:2022-08-31 03:16:28 +0000 UTC2022-08-31 03:16:28 +0000 UTC 2022-08-31 03:16:28 +0000 UTC

Minimax 与迭代深化:如何使用以前的计算?

  • 772

我正在使用AI minimax算法来玩跳棋。
为了获得最佳性能,我使用 alpha-beta 剪辑。

由于在检查器中很难预测在特定位置需要什么深度的搜索,我想使用迭代加深:搜索首先发生在深度 1,然后是 2、3,依此类推。

据我了解,迭代加深的意思是,当计算到n的深度时,我们使用之前执行的计算到n-1的深度,其结果存储(在哈希表/文件中...... )

但是,我并不完全清楚我需要在这个哈希表中存储什么?我应该保存在 minimax 过程中出现的所有位置还是只保存起始深度的位置?

现在我的程序只是按顺序遍历所有深度,而不以任何方式使用先前较不深度计算的结果。

class AI:
    def get_best_move (self, board, time_limit):
        self.analysed_positions = 0
        self.best_move = None
        self.calculation_process = True

        calculation_process = threading.Thread(target=self.iterative_deepening_minimax, args=(board, ))
        calculation_process.start()
        calculation_process.join(time_limit)
        self.calculation_process = False

        return self.best_move


    def iterative_deepening_minimax (self, board):
        for depth in range(2, 30):
            if self.calculation_process:
                # Начинаем поиск на глубине depth, который возвращает лучший ход в этой позиции
                self.best_move = self.minimax(board, depth, -INFINITY, INFINITY, board.whitesMove)[1]
            else:
                break


    def minimax (self, board, depth, alpha, beta, maximizingPlayer):
        if self.calculation_process == False:
            return (0, None)

        board.find_all_moves()

        game_state = board.get_game_state()
        if game_state != STATE_OK:
            self.analysed_positions += 1
            return (INFINITY + depth, None) if game_state == WHITE_WIN else (-INFINITY - depth, None)
        if depth == 0:
            self.analysed_positions += 1
            eval = self.evaluate(board)
            return (eval, None)

        bestMove = None
        if maximizingPlayer:
            maxEval = -INFINITY
            for move in board.moves:
                next_pos = Board(board, search_all_moves=False)
                next_pos.make_move(move)
                next_pos.change_turn()

                eval = self.minimax(next_pos, depth - 1, alpha, beta, False)[0]
                if eval > maxEval:
                    maxEval = eval
                    bestMove = move
                # Pruning
                alpha = max(alpha, eval)
                if beta <= alpha:
                    break
            return (maxEval, bestMove)

        else:
            minEval = INFINITY
            for move in board.moves:
                next_pos = Board(board, search_all_moves=False)
                next_pos.make_move(move)
                next_pos.change_turn()

                eval = self.minimax(next_pos, depth-1, alpha, beta, True)[0]
                if eval < minEval:
                    minEval = eval
                    bestMove = move
                # Pruning
                beta = min(beta, eval)
                if beta <= alpha:
                    break

            return (minEval, bestMove)

    # Возвращает статическую оценку позиции
    def evaluate():
        ...

python искусственный-интеллект
  • 1 1 个回答
  • 28 Views

1 个回答

  • Voted
  1. Best Answer
    Максим Фисман
    2022-09-02T03:23:09Z2022-09-02T03:23:09Z

    简而言之:正确的解决方案是记住在极小极大过程中遇到的所有位置。这称为转置表。


    当某个深度的极小极大得出关于某个位置的最佳移动的结论时(在代码中,这发生在行return (maxEval, bestMove)和中return (minEval, bestMove)),您需要记住以下特征:

    • 位置本身(考虑转牌顺序)
    • 职位评估
    • 在这个位置进行深度搜索
    • 在这个深度的这个位置找到的最好的移动
    class Transposition:
        def __init__ (self, pos, eval, depth, best_move):
            self.pos = pos
            self.eval = eval
            self.depth = depth
            self.best_move = best_move
    

    每次我们要求 minimax 确定给定位置的最佳移动时,我们都会查看该位置是否在转置表中。如果没有,像往常一样继续 minimax。如果有,那么我们需要检查深度:如果转置表中记录的这个位置的深度大于或等于我们正在寻找的深度,那么我们可以使用转置表中记录的最佳移动对于这个职位。

    如果位置记录在表中较浅的深度,那么,唉,这对我们没有帮助,因为我们需要更深入地查看。但是,我们仍然可以使用最佳走法:如果在深度 N 处找到最佳走法,那么在大于 D 的深度处,同样的走法很有可能是最佳走法。

        def minimax (self, board, depth, alpha, beta, maximizingPlayer):
            # ...
         
            # Ищем позицию
            position_index = board.convert_to_number()
            transposition = next((tr for tr in self.transpositions if tr.pos == position_index), None)
            # Если позиция уже встречалась
            if transposition != None:
                # Если глубина нам подходит
                if transposition.depth >= depth:
                    # Используем ранее найденный результат
                    return (transposition.eval, transposition.best_move)
    

    几点评论:

    1. 当我们向表中添加位置时,我们需要确保在较浅的深度没有相同的位置。
    2. 一个有用的解决方案是向转置添加一个属性,以isOnly确定找到的移动是否是唯一的移动。如果该位置只有一招,那么在什么深度找到它并不重要,无论深度如何,我们都可以使用它。

    一个类似的解决方案(可能看起来像拐杖):如果一个位置只有一个移动,则将该位置记录在换位表中,用 depth 解析БЕСКОНЕЧНОСТЬ。

    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5