2016 - 2024

感恩一路有你

阿尔法围棋 阿尔法围棋程序的工作原理?

浏览量:4970 时间:2022-12-25 13:59:39 作者:采采

阿尔法围棋 阿尔法围棋程序的工作原理?

阿尔法围棋程序工作原理?

AlphaGo是一个围棋人工智能程序。这个程序用“价值网络”来计算形势,用“策略网络”来选择下一步。

阿尔法围棋程序的工作原理?

AlphaGo是一个围棋人工智能程序。这个程序用“价值网络”来计算形势,用“策略网络”来选择下一步。围棋(AlphaGo)就是通过两个不同的神经网络“大脑”的合作来提高下棋水平。这些大脑是多层神经网络,结构类似于谷歌图像搜索引擎识别的那些图像。他们从多层启发式二维过滤器入手,处理围棋棋盘的定位,就像图片分类器网络处理图片一样。过滤后,13个完全连接的神经网络层对他们看到的东西产生判断。这些层可以进行分类和逻辑推理。

这些网络通过反复训练来检查结果,然后校对调整参数,使接下来的执行更好。这个处理器有很多随机元素,所以人们不可能确切知道网络是如何“思考”的,但更多的训练可以让它进化到更好。

第一个大脑:移动选择器

AlphaGo的第一个神经网络大脑是“监督学习的策略网络”。观察棋盘的布局试图找到最好的下一步。事实上,它预测了每一个合法的下一步的最佳概率,所以第一个猜测是概率最高的一个。这可以理解为“下拉选择器”。

第二个大脑:位置评估者

AlphaGo (AlphaGo)的第二大脑回答的是另一个相对于下拉选择器的问题。它不是猜测具体的下一步,而是预测每个棋手赢棋的可能性,然后给出棋子的位置。这个“形势评估器”就是“价值网”,通过判断全局来辅助后选人。这个判断只是大概,但是对提高阅读速度很有帮助。通过对“好”和“坏”的潜在未来情况进行分类,AlphaGo可以决定是否通过特殊的变体进行深度阅读。如果情况评估者说这个特殊的变体不好,那么AI将跳过阅读这条线上的任何更多移动。

网络 大脑 神经网络 AlphaGo 围棋

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。