投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

もっと知る統計:統計的検定(1)

もっと知る統計:統計的検定(その1)

今回は、「一様最強力不偏検定」について整理したい。しかしそのためには、「仮説検定」についてひと通りおさらいする必要がある。

例として、ある学校における2つのクラス(各40名)の、同じテストの得点が以下の通りであったとする。

1組:70,68,65,68,73,67,42,85,63,48,55,62,57,50,58,50,65,72,55,73,

75,70,88,78,85,67,72,80,62,52,67,85,67,73,75,88,77,70,73

2組:73,62,73,75,60,63,78,43,45,78,60,65,82,55,65,60,75,53,78,65,

72,70,58,67,63,60,72,63,65,43,68,77,65,77,80,75,77,78,55

平均点は、1組=67.9点, 2組=66.5点である。これらの平均点の間に統計的に差があるかどうかを調べたいとする。

この場合の検定では、まず得点が正規分布にしたがうと仮定する(ノンパラメトリック検定という方法もあるがここでは特定の分布を仮定)。次に、1組,2組の平均点をそれぞれμ12としたとき、「μ1=μ2」という「帰無仮説」を立てる。対立仮説として自然なのは「μ1≠μ2」である。そして、帰無仮説が真であるとした場合の検定統計量を計算する(この場合には分散についていくつかの仮定の仕方があり、検定統計量はそれにより異なる)。その検定統計量が値が本来ならあまり起こりにくいところにある(「棄却域」に入る)とき、帰無仮説を棄却し、「2つのクラスの平均点には有意な差がある」と判断する。棄却域に入らなかった場合は、「2つのクラスの平均点は等しい」と言えるわけではないが、「2つのクラスの平均点の差は誤差に埋もれてしまうほど小さい」と見ることができる。

仮説検定論r1