投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(8月9日付)

前回のこのシリーズの投稿からバタバタしている間にオリンピックが終わってしまった。これは最近始まったことではないが、バレーボールではコーチがタブレット端末片手にデータ分析結果に基づいてリアルタイムに戦略を指南していたし、サッカーでも日本代表チームには優れた分析スタッフがいて、自チームや対戦する相手チームの直近の試合のデータを徹底的に分析しているという話をしていた。スポーツのデータ活用は予算と人材さえあればどこでも始められるようになってきている。
今回は「機械学習」と「スクレイピング」の記事を中心に紹介する。

Pythonコードを高速化する方法
www.kdnuggets.com
インタープリター言語であるPythonを少しでも早く走らせるプログラミング上のコツをいくつか挙げている。

ウェブページのスクレイピングに回帰ベースの機械学習モデルを用いる
www.datasciencecentral.com
ユーザエージェントとブロックされる可能性の関連をモデル化してスクレイピングの効率化を図る。

225個のPythonによる機械学習プロジェクト
medium.com
Python言語を用いた機械学習プロジェクト(問題・データ・コードが掲載されており自分で試して学べる)が225個も紹介さている良記事。初級者向けプロジェクトは最初の方でまとめて紹介されている。

Amazonの商品カタログデータをスクレイピングする方法
www.datasciencecentral.com
Pythonのscrapyライブラリを用いてAmazonの商品カタログデータをスクレイピングする具体的な方法の解説。

顔認識:最新の方法と最良のツール
www.datasciencecentral.com
「知識ベース」「テンプレート照合」「特徴量ベース」「外見ベース」といった顔認識の最新技術の解説と有料/無料で利用できる顔認識ツールの紹介。