投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(10月13日付)

今週から国内旅行に補助金が出る「全国旅行支援」が始まった。自分もさっそく大手旅行会社のサイトでツアーの予約を試みたが、途中でエラー画面でリセットされる事態が何度も起きた。結局何とか予約はできたが、こういった「想定外のアクセスピーク」に対応するシステム作りはなかなか難しいだろうと思った。

成功するダッシュボードをいかに築くか
towardsdatascience.com
データサイエンスの実務ではエンドユーザーが直接操作して分析作業が行える「ダッシュボード」を開発する機会が多い。本記事はビジネス的に成功するダッシュボードを開発するためのコツをまとめている。

Elasticsearch: 重要なコンセプトの入門
towardsdatascience.com
Elasticsearchは特に大量のデータを蓄積・活用するためのシステムとして有名であるが、本記事は自然言語処理全文検索の分野からのElasticsearchのチュートリアルとなっている。

貴方のデータにあるシグナルを集計して見えなくすることを止めよう
stackoverflow.blog
この記事では主として時系列データを簡素化のために安易に集計してしまう前にやるべきこを説いている。

t-SNE, UMAP, PCAや他のマッピング手法の類似性
towardsdatascience.com
特徴量の次元縮約としては主成分分析(PCA)が有名だが、ここでは非線形のものも含めたいくつかのマッピング手法について丁寧に解説している。

Poetryでデータサイエンスプロジェクトを管理する
towardsdatascience.com
Pythonによる開発プロジェクトでは通常pipによりライブラリをインストールするが、依存関係などで問題になることがある。ここではpipの代替となるPoetryというツールを用いたプロジェクト管理について解説している。