投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

身近な統計(3):偏差値

身近な統計(その3):偏差値

一般的に用いられる統計処理として最も広く用いられているものに「偏差値」がある。

この基本となるデータ処理は、データが正規分布に従うと仮定した場合の「標準化」である。正規分布には2つのパラメータがある。一つは分布の位置を示す「平均」で、通常μというギリシャ文字を用いる。もう一つは分布のバラツキの大きさを示す「分散」で、通常はその平方根である「標準偏差」をσで表す。分散はσ^2となる。

このデータの各個体の値から平均値を引き、標準偏差で割ると、平均0、分散1(標準偏差も1)となる。この作業を「標準化」という。偏差値は、テスト点数の平均が50、標準偏差が10になるようにする標準化である。すなわち、偏差値を求めるためには、以下の3つの作業を行う。

(1)データの平均値と標準偏差を求める

(2)データの各個体の値から平均値を引き、標準偏差で割った「標準得点」を求める

(3)上記標準得点に10を乗じ、その後50を加える

受験者数が多いテストの得点は正規分布のような釣鐘型になることが多い。そのため、科目や集団間での比較を可能とし、各個体が分布上のどの位置にあるかをわかりやすくするために、標準化がなされる。ただし平均0、標準偏差1では直感的にわかりにくいため、平均50、標準偏差10にしたものが偏差値である。

正規分布

もしテスト得点が正規分布に従っているとすれば、平均値±標準偏差*1.96の外側の確率は0.05である。おおまかには標準偏差×2と覚えておけばよい。つまり偏差値70を超える人の割合は全体の2.5%しかいないということになる。

より専門的であるが、分布の形がどのようなものであろうとも、平均を中心に標準偏差の2倍より外側をとる確率は1/4を超えないことが「チェビシェフの不等式」より導かれる。正規分布のような釣鐘型の場合は、平均プラスマイナス2σの外側になる確率はより小さいものになる。

チェビシェフの不等式r1

あまり使いたくない事例であるが、関東圏の私立大学文系の偏差値の高い大学・学部は以下のようになっている。(出典:ベネッセ)

偏差値,学部学科

83 慶応義塾大(法)

82

81 慶応義塾大(経済),早稲田大(政治経済)

80

79 慶応義塾大(総合政策)

78 慶応義塾大(商),早稲田大(法),早稲田大(商)

77 早稲田大(社会科),早稲田大(国際教養)

76

75 上智大(法),中央大(法)

74 立教大(経営)

73 上智大(経済),上智大(国際教養),明治大(法)

72 青山学院大(国際政治経済),上智大(総合グローバル),立教大(法),立教大(社会),早稲田大(人間科-人間環境科)

71 明治大(政治経済),明治大(商),明治大(国際日本),立教大(経済),早稲田大(人間科-健康福祉)