投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

身近な統計:ワールドカップの得点分布(その1)

身近な統計(特):ワールドカップの得点分布(その1)

以下の数字は、2010年ワールドカップサッカー南アフリカ大会のグループリーグ全48試合における各チームのゴール数である。これは、2012年の「統計検定」一級の問題に用いられた(文献1)。

ゴール数   0   1   2   3   4   5   6   7

度数    35  35  18  5   2   0  0   1

度数の合計は、1試合2チームなので48×2=96である。ゴール数×度数の総合計は0*35+1*35+2*18+3*5+4*2+7*1=101となり、1試合1チーム当りの平均ゴール数は101/96=1.052である。

それでは、現在行われているブラジル大会はどうなっているであろうか。日本時間の6月16日までのところ以下のようになっている。

ゴール数    0  1   2  3   4   5   6   7

度数     3   9   4   5   0   1   0   0

度数の合計=22である。ゴール数×度数の総合計は0*3+1*9+2*4+3*5+5*1=37となり、1試合1チーム当りの平均ゴール数は37/22=1.682である。ぱっと見たところでは3ゴールあげたチームが前回よりもかなり多くなり、得点ゼロのチーム数が少なくなりそうであるなど、平均ゴール数が前回よりも多くなるような感じである。

これがどのような問題で用いられたかについては、グループリーグ終了後にお話することとしたい。

(文献1)「統計検定 問題と解説(2012年)1級・RSS/JSS試験」実務教育出版