投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2021-02-01から1ヶ月間の記事一覧

スプレッドシートによるデータアナリティクス(8) 回帰分析(LINEST関数の利用)

本シリーズの第3回目で、散布図の上にトレンド線を引く方法を解説しました。その直線の係数は「最小二乗法」により求めること、統計学ではこれを「回帰分析」ということを書きました。散布図のトレンドを示す回帰直線は、回帰分析では最も基本的な形で、被説…

データサイエンスのおすすめオンライン記事(2月17日付)

コロナの波は明確にピークを過ぎてきており、日本でワクチン接種も始まった。今後は何が元に戻り、何がニューノーマルのままになるのかを見極めていくことが重要になるだろう。今回のパンデミックは全世界でDXの推進要因になったわけだが、今回紹介する記事…

スプレッドシートによるデータアナリティクス(7):相関係数表の出力

数多くの特徴量がある場合に、それらが相互にどのように関連しているかを把握することは様々な場面で必要になります。特に社会経済分野においては、各特徴量が経済成長率や人口などの「交絡要因」を媒介として相互に高い直線的関連性を有しているケースが多…

スプレッドシートによるデータアナリティクス(6):基本統計量を表示させる

これまで、単一の特徴量の分布の様子を視覚的に捉える方法として「ヒストグラム」と「箱ひげ図」を取り上げ、スプレッドシート上での描画方法を解説してきました。 データの分布の性質として最も基本的な要素は「分布の位置」と「分布のばらつき方」で、前者…

スプレッドシートによるデータアナリティクス(5) 統計解析アドインのインストール

Excelの関数にはさまざまな統計解析の機能が装備されています。例えば、データの平均を求める場合は=average(データセルの範囲)、データの標準偏差を求める場合は=stdev(データセルの範囲)により求まります。さらに、=linest()関数を用いれば回帰分析(単回…

スプレッドシートによるデータアナリティクス(4):箱ひげ図

特徴量の分布の様子をみるための典型的なツールは「ヒストグラム」ですが、ヒストグラムは複数の分布の様子を並べて比べるのには難があります。また分布の位置やばらつきを示す指標を比べるのにも適しません。 それに対して「箱ひげ図」(boxplot)は分布の中…

データサイエンスのおすすめオンライン記事(2月2日付)

コロナ新規感染者は減少傾向にあるが、緊急事態宣言は主要地域で延長される見通しである。今日の昼はアメリカンのバーガーレストランで昼食を取ったが、そこの店も昼飲み客を取り込んで何とかやっていこうという雰囲気だった。立春とともに気分も明るくなる…