投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(1月2日付)

明けましておめでとうございます。様々な事業主体においてデータを活用して効率化を図ったり戦略的な意思決定に役立てるための科学的アプローチへのニーズはますます高まっています。本年もデータの統計的分析やデータサイエンスに携わる皆さんに少しでも役立つような記事を投稿していく所存です。

再急降下法の仕組み
towardsdatascience.com
「再急降下法」は機械学習で損失関数を最小化するために用いられるアルゴリズムだが、その仕組みをわかりやすく解説している(数式あり)

全てのデータサイエンティストが知っておくべきデータエンジニアリングの4つの基本事項
www.analyticsvidhya.com
データの分析やモデル化の前段階としてデータの獲得・整形といった「データエンジニアリング」の作業が必要になる。ここでは1)データウェアハウスとデータレイク, 2)データの抽出・変換・装填のパイプライン, 3)データのガバナンスと品質, 4)データの規制と倫理, について解説している。

貴方のPythonコードを改善する4つのコツ
betterprogramming.pub
Pythonのプログラムコードの可読性と処理効率を高めるためのコツ。多重代入や条件分岐を1行で表すなど。

機械学習モデルを実装する3つの方法
towardsdatascience.com
ビジネス現場ではモデルを構築したらいかに実装するかが重要となる。ここでは1)Webサービス, 2)バッチ予測, 3)エッジデバイスへの実装, について実例コードで紹介している。

PyHard: データセットの品質を評価し、分類困難なインスタンスを同定するツール
www.datasciencecentral.com
「データの何処が分類精度を下げているのか」や「アルゴリズムの効率がよくなるデータセットの領域はどこか」を知るうえで役立つ新しいPythonライブラリについての解説。

解釈可能な予測・ナウキャストモデルを構築する:DeepXFの概要
www.datasciencecentral.com
予測やナウキャストに適用できるローコードPythonライブラリDeepXFについての紹介。詳細は上部のリンクからGitHubのページを参照する。