AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用を止めて自分の経験に頼るようになったか (udemy.com)
囲碁AIの強化学習アルゴリズム:AlphaGoから、人の知識なしでゼロから学習に成功した強化学習モデル のゲームAI「AlphaZero」 を、初心者・中級者向けに実行教材とイラストで解説していきます。将棋AIとしても成果を出しています。
内山 充康
機械学習