Q学習とは、強化学習の一種です。 ある状態である行動をしたとき、将来どれだけ報酬が得られそうかを表す Q値 を更新しながら、よりよい行動を学ぶ方法です。
Right-click 'Download' and select 'Save Link As' if the file opens in a new tab.