投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(3月4日付)

欧州で戦争勃発など慌ただしい中、首都圏ではマンボウも延長されたが、街の賑わいは春を迎える準備を進めているように感じられる。新年早々は興味深いデータサイエンスの記事が少なかったが、春を告げるかのごとく最近一気に面白い記事が増えてきた。しかし今回も昨年末位に発表された記事が中心となっている。

2022年によりよいデータサイエンティストになるための22の習慣
towardsdatascience.com
「コーディングの標準スタイルを取り入れる」「常に変化に前向きでいる」「コードをシンプルに」などを説いている。

ごく少数のプログラマーしか知らないPythonの5つの利用事例
levelup.gitconnected.com
Pythonによるモバイルアプリ制作」「ブラウザ上でPythonを走らせる」「シェルスクリプトを書くためのPython」「Python風ハイブリッドデスクトップアプリを構築する」「短時間でCommand Line Interfaceプログラムを作り出す」について簡単に解説している。

最適なスクレイピング技術:CSSセレクタ, XPath, RegEx
www.datasciencecentral.com
スクレイピングはほとんどの場合HTMLドキュメントに対してなされるが、さらに上級を目指すなら XPathRegExも知っておいた方がいいとしている。

PythonとScrapyを用いてGoogle検索データをスクレイピングする
www.datasciencecentral.com
Googleの検索結果ページをスクレイピングすることは、自社製品のレビュー情報を収集する場合などに有効である。ここではPythonのScrapyライブラリを用いている。

2022年に知っておくべき全ての機械学習アルゴリズム
towardsdatascience.com
「アンサンブル学習」「説明的(回帰)」「クラスタリング」「次元縮約」「類似性」の5つのタイプの機械学習アルゴリズムについて概要と代表的アルゴリズムを解説している。