投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

スプレッドシートによるデータアナリティクス(2) :2つの特徴量の関連性をみるための散布図

特徴量が一つの場合は、ヒストグラムによりその分布の様子を見ることが基本になりますが、特徴量が2つの場合は、その関連性を見ることが多くの場合必要になります。
例えば「気温と電力使用量との関連」を見るといった場合です。この場合の基本は「散布図」を描くことになります。
今回は、基本的な散布図の描画方法についてまとめました。

Excelによる散布図の描き方】
関係を見たい2つのデータ項目をシート上で隣接した列になるように配置する
2つの列を同時に選択し、画面上側のメニューから「挿入」→「グラフ」→「散布図(軸と点のグラフの絵)」を選択
f:id:nicjps230:20210127141127j:plain
グラフ右上の+印(グラフ要素)をクリックし、グラフタイトルや軸ラベルを追加・修正する
※まず「挿入」→「グラフ」→「散布図」で空のグラフを挿入してから、上側「データの選択」メニューで特徴量を指定することもできます

Googleスプレッドシートによる散布図の描き方】
上側メニューの「挿入」→「グラフ」を選択してグラフエリアを表示させる
「グラフの種類」プルダウンメニューから「散布図」にある「散布図」(軸と小さい点のグラフの絵)を選択
f:id:nicjps230:20210127141156j:plain
「グラフエディタ」の「設定」タブの「データ範囲」をクリック
「データ範囲の選択」ウィンドウで、シート上のデータの隣り合った2列をクリックして指定→OK
2つの列が隣り合っていない場合は、「グラフエディタ」の「設定」タブで、「X軸」と「系列(Y軸)」を別個に指定する。
グラフエリアの右上の点3つのボタンをクリック→メニューから「グラフを編集」→グラフエディタが立ち上がる→「カスタマイズ」タブでタイトルや軸の値の範囲などを記入する
※まず2つの列を選択してから「挿入」→「グラフ」でグラフを表示させて、その後散布図を選ぶこともできます
f:id:nicjps230:20210127141245j:plain