投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

身近な統計:2×2分割表

身近な統計:2×2分割表

以下の集計表は調査対象の人々を「性別」と「利き腕」によってクロス分類した2×2分割表である(出典:ウィキペディア)。このような分割表はしばしばお目にかかる。

分割表例1

この場合は無作為に100人を抽出してそのサンプルを「性別」と「利き腕」とで分類集計したものである。一方、以下の表は見た目は同じでも、横方向は2つの治療法についての異なるグループであり、若干意味合いが異なる。

分割表例2

今回は上の表の分析方法について整理する。この調査をした目的は「性別」と「利き腕」の間に関連があるかどうかを調べることである。通常は「独立性のカイ二乗検定」を行うが、この検定は近似であるため、セルの度数が小さい場合は、「イェーツの補正」を行う必要がある。

尚、下の表も実務的には同様に分析する。実際に補正された統計量を計算すると、上の表=1.072、下の表=1.026となる。有意水準5%の場合の棄却域はχ^2>3.841で、いずれも棄却されない。下の表は一見するとかなり関連がありそうに見えるが、実際にサンプル数がある程度以上ないとなかなか棄却域には入らない、というのが実態である。

分割表検定1