備忘録的な

プログラミングや機械学習に関する備忘録

機械学習

論文:Reward function and initial values : Better choices for accelerated Goal-directed Reinforcement Learning

The International Conference on Artificial Neural Networks (ICANN) 2006 の論文. hal.archives-ouvertes.fr強化学習において,報酬と初期値の決め方大事だよね,という話. 2値報酬&一様初期値の場合 ゴール状態の報酬が,それ以外の報酬がのとき,も…

scikit-learnのStratifiedKFoldの結果が0.19とそれ以前で変わる件

scikit-learnのStratifiedKFoldが0.18.2から0.19.0への変更で、実行結果が異なるようになりました。 それも、shuffle=Trueとしたときだけです。 StratifiedKFoldは識別の際にラベルの数の偏りを考慮した分割をするため有用ですが、 このことを覚えておいた方…

論文:Simple Nearest Neighbor Policy Method for Continuous Control Tasks

サマリー ICLR 2018に投稿されてdouble-bline review中の論文。 主張:強化学習の難しさには、タスク自体の難しさと最適化の難しさの2種類があり、これらは分けて考えるべきである 提案:最近傍法に基づく最適化不要な強化学習手法 考察 Double PendulumやCa…

「ゼロから作るDeep Learning」を読んだ

評判に違わずとても良い本でした。 副題に「Pythonで学ぶディープラーニングの理論と実装」とあるように実装を重視しており、単純パーセプトロンから多層パーセプトロン、畳み込みニューラルネットワークまで、丁寧な解説で実装方法を理解することができます…

機械学習によるデータ分析まわりのお話

機械学習によるデータ分析について,できるだけ広く浅くまとめてみました.アルゴリズムの詳細やツールの使い方などにはほとんど触れず, 実際にデータ分析を行う際の注意点などに重きをおいています. 機械学習によるデータ分析まわりのお話 from canard0328