try to solve the reju game with AlphaZero- like algorithm
这个项目的目标是通过MCTS和神经网络(tensorflow) 构建一个五子棋(连珠)的AI。
最近的任务
- 类和对象的架构设计
- 自训练、人类对局、棋谱训练的逻辑设计好
- 后面得有个像样的界面吧。。。
- 去看一下这个 https://zh.wikipedia.org/wiki/Alpha-beta%E5%89%AA%E6%9E%9D
- AlphaGo 相关 https://zhuanlan.zhihu.com/p/20607684
- 基本MCTS http://mcts.ai/project/index.html
- Alpha beta http://www.wukai.me/2018/03/04/minimax-alpha-beta-pruning-and-tic-tac-toe/
- Tensorflow 到底是怎么对照学习的。。。 还是得参考那个Alpha_Gomoku 的代码。 tf.train.AdamOptimizer(learning_rate=self.learning_rate).minimize(self.loss)
- 这个我比较关注 https://blog.csdn.net/chengcheng1394/article/details/79526474 这里说到了一些细节
- TODO 残差网络 https://blog.csdn.net/liangyihuai/article/details/79140481
- https://blog.csdn.net/qq_29462849/article/details/80744522
- https://blog.csdn.net/diamonjoy_zone/article/details/70904212
- https://www.jianshu.com/p/655caf23ebc8