投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

統計学の基本数式 (6) 中心極限定理

大数の法則では算術平均が分布の期待値に近づいていくことが示された。n個の観測値の和をnで割ると一点に収束していくが、収束するまでの分布はどのような形になっているであろうか?n個の観測値の和をnの平方根で割った場合は、元の分布がどのようなものであっても、正規分布に近づくことが示される。この中心極限定理は、様々な検定統計量の有意確率を評価する際の基礎となる。ほとんどの場合、検定統計量の厳密な確率分布は求めることができないが、nが大きくなると正規分布に近く(漸近正規性)なる性質を利用して、例えば帰無仮説が正しい場合の検定統計量の分布を評価し、それが非常に稀にしか起こらないような量であれば、帰無仮説そのものを棄却することになる。

(定理1) X_nを、モーメント母関数M_{X_n} (t) を持つ確率変数とし、Xを、モーメント母関数M_X (t) を持つ確率変数とする。もし、


\lim_{n \to \infty} M_{X_n} (t) = M_X (t)

ならば、X_nの分布関数(cdf)は、n \rightarrow \infty Xの分布関数に収束する。

中心極限定理X_1,X_2,\cdots,X_nが互いに独立で同一の分布にしたがう確率変数とし、分布の平均を \mu、分散を\sigma ^2、モーメント母関数をM_X (t)とする。n \rightarrow \infty のとき、Z=\frac{T-n \mu}{\sigma \sqrt{n}} (ただしT=X_1+X_2+ \cdots + X_n)の極限分布は、標準正規分布N(0,1)である。

中心極限定理の証明は、モーメント母関数の極限が正規分布のモーメント母関数になることを導く方法が一般的である。