投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

統計まとめ:主成分分析

6月25日の本ブログで、学校の英語と数学のテスト点数の散布図を示した。そこで、「基本的学力」のような潜在的な尺度(真の尺度ではなくあくまでも解釈上のもの)を見える化するために、「多変量解析」の諸手法が用いられることを述べた。

 

多変量解析についてはじっくり記述したいところだが、今回は都合により簡単にとりまとめる。まず最初は「主成分分析」である。主成分分析を直感的に理解するのにもっとも適した図は以下の図である。

 

主成分分析

 

 

英語と数学のテスト点数の散布図の場合には、第1主成分だけで全体の変動のかなりの部分を説明できることがわかる。この第1主成分を「基本的学力」と解釈するのは妥当であろう。

 

尚、以下の式の記述は(文献7)に基づくものである。

 

(文献7)永田靖、棟近雅彦「多変量解析法入門」サイエンス社

 

主成分分析r1