投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(10月21日付)

本日は我が家の光回線工事に立ち会うために終日在宅し、遅まきながら我が家にもようやく光回線が入った。想えば20年以上前のまだインターネットが普及する前に「誰が家庭に光ファイバー回線(FTTH)を引くのか」といった事に仕事で関わってから長い年月が経ったものである。

Pandas Profiling :Pythonで簡単にできる探索的データ解析
towardsdatascience.com
探索的データ解析(EDA)のツールとして、Pandasデータフレームの概要レポートを自動生成してくれるライブラリpandas-profilingのチュートリアル記事。

Streamlitによるウェブアプリケーション作成入門
towardsdatascience.com
PythonベースでのWebアプリケーション開発ツールは、本ブログでもDashライブラリなどいくつか紹介してきた。本記事で紹介しているStreamlitもPythonベースで手軽にWebアプリケーションを開発するためのツールである。

LineaPy: たった2行でのデータサイエンスワークフロー
towardsdatascience.com
あるプロジェクトの中で個々のデータサイエンティストがJupyter Notebookなどでデータ分析コードを勝手に開発しても、プロジェクト全体からすれば非常に管理しづらいものとなってしまう。本記事は一連の開発パイプラインを効果的に管理するためのLineaPyライブラリについて解説している。

ニューラルネットワークを用いた現代レコメンドシステム
towardsdatascience.com
レコメンドシステムの構築については多くの記事が出ているが、本記事は伝統的方法と近年のより高度な方法についてのチュートリアル記事(GitHubへのリンク付き)となっていて、読者がすぐに自分のケースへ適用できることを強調している。

2022-2023のデジタル・インフルエンサートップ50名
ipfconline.fr
最新ののトップインフルエンサーについての記事。本ブログでもお馴染みの、Andrew Ng氏、Kirk Borne氏、Bob E. Hayes氏、Data Science Centralなどが名を連ねている。