投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(5月3日付)

ゴールデンウイークも中盤になっている。今年は日の並びもよく、しかもこの中盤は首都圏では天気もいい。観光地の人出もかなりコロナ前に戻っているということで、明るい材料が揃った感じである。今回はPython関連の記事を中心に紹介する。

貴方のPythonコードをより効率的にする5つの簡単なテクニック
towardsdatascience.com
(1)関数を使う, (2)不要な演算をしないようにする, (3)パッケージを活用する, (4)不要な変数を宣言しないようにする, (5)必要な所でループから抜け出す

ベイズ統計の概要と(入門としての)ベイズ回帰モデル
towardsdatascience.com
ベイジアンについての入門記事はいくつか紹介してきているが、これもその一つで、ベイズ回帰モデルとそのオープンデータへの適用が紹介されている。

Fugue and DuckDB: Python内のSQL高速実行コード
towardsdatascience.com
Python内でSQLが使えるライブラリとしてはSQLite3が有名だが、ここで紹介されているPythonライブラリは高速なのが特徴である。

Pandasql: PythonSQLクエリを走らせる興味深い方法
towardsdatascience.com
上と同様にPython内でSQL記述でデータ処理ができるライブラリpandasqlの紹介。

CSVの向こう側:Pandasでのデータ獲得
towardsdatascience.com
Pandasデータフレームにデータを読み込む際によく使われる文はpd.read_csvであるが、pd.read_xxxのxxxとしてcsv以外にもexcel,html,sql_query,jsonが使えることの紹介。私もcsv,excel以外は使ったことがなかったので「目から鱗」だった。