他不是算最有效力的子,而是赢其概率最大的子。
第二,他假设对手一定能下出最强手
所以他下棋有时候很不讲面子下出扳沾俗手,有时候却会下的非常保守。
昨天右边alphago下的,在中国职业初段这么下都会被打屁股, 把余味全下没了自己也没落好。所有人都看不懂
是的,阿发狗在Policy Model提出的Suggestion Moves里通过评估对比选择出赢棋概率相对最大的那个Move
我感兴趣的是AlphaG其实是没有师傅教棋理什么的,就是自己看棋谱学习,然后自己跟自己不停下棋训练自己提高自己,完全是自我学习训练调整NN模型中各神经元之间的Weights (链接权重),这样训练好了的模型,有了输入(就是对手落子位置)就会象人一样得出自己的输出(自己应对的落子)。。。很有趣