投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

もっと知る統計:カイ二乗分布(1)

もっと知る統計:カイ二乗分布(1)

今回より「もっと知る統計」シリーズを並行して連載いたします。内容はテクニカルですが、大学の先生が書かないような実務面も記述していきます。

ワールドカップ関連のブログで、「カイ二乗分布」を扱った。このカイ二乗分布は、標準正規分布の二乗の和がしたがう分布である。平均を差し引いて標準偏差で割る「標準化」は、検定統計量を求める場合などに頻繁に行われる。大雑把に言えば、この標準化の中で、分母が(仮定した)真の値である場合には、カイ二乗分布が用いられる。一方、分母が(真値でなく)サンプルからの推定量の場合は、t分布が用いられる。具体的にカイ二乗分布が用いられる主な場面は、ワールドカップのところで行った「適合度検定」や、「分割表における独立性の検定(ただしこの場合は近似的にカイ二乗分布となる)」「尤度比検定(対数尤度の2倍がカイ二乗分布に分布収束する)」である。

今回はカイ二乗分布の一般形であるガンマ分布について述べ、その後カイ二乗分布について解説する。尚、本稿の記述は主として(文献4)に基いており、細部を自分で埋めたものである。

(文献4)田栗正章「統計学とその応用」放送大学教育振興会, 2005

※数式の体裁を一部修正しました(2014/8/28)。

ガンマ分布r1