サマリー ICLR 2018に投稿されてdouble-bline review中の論文。 主張:強化学習の難しさには、タスク自体の難しさと最適化の難しさの2種類があり、これらは分けて考えるべきである 提案:最近傍法に基づく最適化不要な強化学習手法 考察 Double PendulumやCa…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。