2017-12-03から1日間の記事一覧

論文：Simple Nearest Neighbor Policy Method for Continuous Control Tasks

論文機械学習

サマリー ICLR 2018に投稿されてdouble-bline review中の論文。主張：強化学習の難しさには、タスク自体の難しさと最適化の難しさの2種類があり、これらは分けて考えるべきである提案：最近傍法に基づく最適化不要な強化学習手法考察 Double PendulumやCa…