備忘録的な

プログラミングや機械学習に関する備忘録

2014-07-01から1ヶ月間の記事一覧

scikit-learn 0.15.0

scikit-learnが0.15.0になってRandom Forestが速くなったと言っているので試してみました. Huge speed and memory improvements to random forests (and extra trees) that also benefit better from parallel computing ベンチマーク用のコードは以下 tota…

pandas備忘録

read_csv data = pd.io.parsers.read_csv('c:\test.csv', sep=',', header=None, na_values=['-'], dtype={0:'str', 1:'str', 2:'str', 3:'str'}) 文字列置換 data[0].replace('(\d{4})(\d{2})(\d{2})', '\\1-\\2-\\3', regex=True, inplace=True) groupby d…