投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2014-06-01から1ヶ月間の記事一覧

もっと知る統計:カイ二乗分布(1)

もっと知る統計:カイ二乗分布(1) 今回より「もっと知る統計」シリーズを並行して連載いたします。内容はテクニカルですが、大学の先生が書かないような実務面も記述していきます。 ワールドカップ関連のブログで、「カイ二乗分布」を扱った。このカイ二乗分…

ワールドカップの得点分布(3)

ワールドカップの得点分布(3):ブラジル大会 ワールドカップブラジル大会のグループリーグが終了した。アジア勢は一試合も勝てなかったという厳しさだった。 それではゴール数の分布, 平均, 適合度検定の結果を見てみよう。 平均ゴール数は南ア大会の1.052か…

ワールドカップの得点分布(2)

ワールドカップの得点分布(その2:テクニカル) ワールドカップ・ブラジル大会も明日でグループリーグ終了である。日本にとっては大変厳しい結果となったが、ここでは今大会のゴール数を中心にデータの読み解きをしてみよう。今日はその準備段階である。今…

身近な統計(5):相関と因果

身近な統計(5):相関関係と因果関係 2つの変数間に相関関係があるからといって、その変数に対応する事象間に因果関係があるとは限らない。これはネット上でもさまざまな解説がなされている。問題はこのような相関関係と因果関係の混同が知識不足だけでなく意…

身近な統計(4):相関

身近な統計(4):相関 前回は学力テストデータを題材にしたので、しばらくその関連のテーマについて話をする。以下のデータは16名の架空の中学生の「数学」「理科」「英語」の試験の点数である。 以下の図は「数学」と「理科」の点数の関連性をみるための散布…

身近な統計(3):偏差値

身近な統計(その3):偏差値 一般的に用いられる統計処理として最も広く用いられているものに「偏差値」がある。 この基本となるデータ処理は、データが正規分布に従うと仮定した場合の「標準化」である。正規分布には2つのパラメータがある。一つは分布の…

身近な統計(2):箱ひげ図

身近な統計(その2):分布を見える化する「箱ひげ図」 時流に乗ってしばらくワールドカップねたで書いたが、グループリーグ終了後にもう一回書くこととして、身近な統計シリーズに戻る。 身近な統計(その1)で、以下の仮想データを用いて平均値と中央値を…

身近な統計:ワールドカップ勝敗分析の「まともな」レポート(2)

身近な統計(特)ワールドカップ勝敗分析の「まともな」レポート(2) 前回紹介した米国ゴールドマンサックス社によるレポート(スポーツナビのブログから入手可能)についてもう少し説明しよう。 前回記述したポアソン回帰モデルによって、2014年ワールドカッ…

身近な統計:ワールドカップ2014のまともな分析予測レポート(1)

身近な統計(特):ワールドカップ勝敗分析の「まとも」なレポート(1) ネットでワールドカップに関する分析について探していたら、米国ゴールドマンサックス社による事前分析レポートがスポーツナビのブログに紹介されていた(原文レポートもそこから入手可…

身近な統計:ワールドカップ視聴率の精度は?

6月15日(日曜日)午前中に放映されたサッカーワールドカップ日本×コートジボワール戦の視聴率は、関東地区の瞬間視聴率が50%を超えたと報ぜられた。 TV番組の視聴率はTVをつけているかいないかに関係なく、TVを持っている世帯数が分母、視聴した世帯数が分…

身近な統計:ワールドカップの得点分布(その1)

身近な統計(特):ワールドカップの得点分布(その1) 以下の数字は、2010年ワールドカップサッカー南アフリカ大会のグループリーグ全48試合における各チームのゴール数である。これは、2012年の「統計検定」一級の問題に用いられた(文献1)。 ゴール数 0 …

身近な統計(その1)平均値と中央値

身近な統計(その1):平均値と中央値 本日より、統計データ解析についての話をいたします。まずは、「身近な統計」シリーズです。不定期で他の話題を書くこともあります。 今回は、統計データを要約する手段としての「平均値」と「中央値」について考える。…

経済的付加価値(その2)

高度成長時代、日本は原材料や安い化石燃料を海外から輸入し、製品として付加価値をつけて海外に売って稼いでいた。しかし現在ではこれは一部の特殊技能を必要とする企業に限られているといってよい。それらはグローバルなサプライチェーンに組み込まれてい…

経済的付加価値(その1)

経済的な付加価値はいかにして創出されるのかをあらためて考えてみたい。 国民総生産=消費+投資、などの定義式はある。あるいは国内総生産=国内の付加価値額ー中間投入、である。 ではこの「国内の付加価値」とは何であろうか。 まず、簡単な例として、木…