AIでブロック崩しを学習させよう。Advantage Actor-Critic(A2C)で学ぶ強化学習の応用編 (udemy.com)

A3C(Asynchronous Advantage Actor-Critic)の発展型モデル A2C を使って強化学習を体験してみよう。
内山 充康
機械学習
- レビュー
- 4.2 (15件のレビュー)