備忘録的な

プログラミングや機械学習に関する備忘録

論文

論文のResearch questionsとContributionsの書き方

英語論文を書いていて,主にIntroductionでResearch questionsとContributionsを書く時に,毎回「どんな表現があったかな?」と調べている気がするのでメモしておきます.参考にした論文は,読んでいてこの人の書き方は上手だなと思ったものや,早稲田大学の…

論文:Waiting Lines as a Marketing Issue

TwitterのTLで見かけて興味を持ったので読んでみました.Waiting Lines as a Marketing Issue Michel Kostecki European Management Journal Vol. 14, No. 3, pp. 295-303, 1996 www.sciencedirect.com色々なサービスの待ち時間について論じたものです. 待…

論文:Reward function and initial values : Better choices for accelerated Goal-directed Reinforcement Learning

The International Conference on Artificial Neural Networks (ICANN) 2006 の論文. hal.archives-ouvertes.fr強化学習において,報酬と初期値の決め方大事だよね,という話. 2値報酬&一様初期値の場合 ゴール状態の報酬が,それ以外の報酬がのとき,も…

論文:Simple Nearest Neighbor Policy Method for Continuous Control Tasks

サマリー ICLR 2018に投稿されてdouble-bline review中の論文。 主張:強化学習の難しさには、タスク自体の難しさと最適化の難しさの2種類があり、これらは分けて考えるべきである 提案:最近傍法に基づく最適化不要な強化学習手法 考察 Double PendulumやCa…