Sen(Qian)’s Memo
This website is Donglin Qian (Torin Sen)’s memo, especially about machine learning papers and competitive programming.
Reinforcement Learning
2024-04-16
強化学習第1回講義
強化学習の種類。オンライン学習、オフライン学習 モデルベース、モデルフリー Episode-based & Step-based, On-Policy & Off-Policy
