投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめウェブサイト(6/12)

政府がIT人材を毎年数十万人規模で育成する案を取りまとめたが、「20年遅い」や「多重下請け構造の変革が先決」などのもっともな意見が出されている。政府の官僚機構が示した枠組みからはまともなIT企業は成長しなかったというのがこの30年間の教訓である。

データサイエンスでは「スーパーマン」より「バットマン」になることを考える。 データサイエンティストは、地球以外の星から来て超自然的力を持つ「スーパーマン」よりも、ベルトから25のツールを出して人々の苦難を救う「バットマン」に例えられる。

気候変動研究でビッグデータが用いられる3つの方法 膨大な地点でのモニタリング、大規模なモデルシミュレーションと出力データ、モデルは「主観的」であり現実への同化が必要。

ビッグデータを意味のあるものにするために:サンプル、母集団、サンプリング誤差 Bob Hayes氏のやや古い記事だが、ビッグデータでも統計的推論が重要であることを説いている。文系が支配的な日本のネット論壇ではほとんど見かけないタイプの記事。

知っておくべき回帰分析の7つの手法 線形、ロジスティック、多項式、ステップワイズ、リッジ、Lasso、ElasticNetの各回帰分析の解説。

無料の機械学習の書籍リスト 形態はPDFやウェブなど色々だがとにかく無料で読める機械学習の英文電子書籍8冊。