投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

統計学の基本数式 (4) 大数の弱法則

チェビシェフの不等式


P(|Z-E(Z)| \geq \epsilon ) \leq \frac{V(Z)}{\epsilon ^2}

において、 Z=\frac{1}{n} \sum_{i=1}^n X_i であると考える。ここで各xは互いに独立で同一の分布に従うとする。この場合の期待値は以下のようになる。


E(Z) = \frac{1}{n} \sum_{i=1}^n E(X_i)=\frac{1}{n} \cdot n \mu = \mu

また分散は、互いに独立であることから異なる添え字の変数間の共分散がゼロとなるため、以下のようになる。


V(Z) = \frac{1}{n^2} \sum_{i=1}^n V(X_i)=\frac{1}{n^2} \cdot n \sigma ^2 = \frac{\sigma ^2}{n}

期待値と分散の結果を上のチェビシェフの不等式に代入すると以下のようになる。


P(|\frac{1}{n} \sum_{i=1}^n X_i - \mu | \geq \epsilon ) \leq \frac{\sigma ^2}{n \epsilon ^2}

ここでnを大きくしていけば、\frac{\sigma ^2}{n \epsilon ^2} は0に近づく。すなわち以下が成り立つ。

大数の弱法則)任意の正の実数εに対して、


P(|\frac{1}{n} \sum_{i=1}^n X_i - \mu | \geq \epsilon ) \rightarrow 0 \hspace{18pt}(n \rightarrow \infty )

これはサンプルサイズを増やしていくと算術平均が期待値に近づいていくことを意味している。

(余談) 「大数の法則」は保険業界にとっても重要な用語である。保険はつまるところ冷徹な(頻度論的)確率の支配する世界である。生命保険共済の保障内容を説明し確認する「ライフアドバイザー」は、顧客の人生の助言ができるとは思えないが、冷徹な世界に人間味を持たせるという存在意義があるのだろう。