投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

身近な統計

条件付き確率とベイズの定理(新型コロナウイルスを例に)

今回は、新型コロナウイルス問題と関連して、条件付き確率とベイズの定理について考えてみます。本記事はデータサイエンス英文サイトをベースに作成しました。 【新型コロナウイルスに感染している可能性は?】 あなたはある朝目を覚ますと、せきや発熱の症…

身近な統計:消費者物価指数とラスパイレス指数

身近な統計:消費者物価指数とラスパイレス指数(1) 経済指標としてよくニュースなどで報じられるものに「消費者物価指数(CPI)」がある。これは消費者物価全体の水準が基準時点に対してどれくらい上下したかを表す指数である。この消費者物価指数の計算方式に…

身近な統計:2×2分割表

身近な統計:2×2分割表 以下の集計表は調査対象の人々を「性別」と「利き腕」によってクロス分類した2×2分割表である(出典:ウィキペディア)。このような分割表はしばしばお目にかかる。 この場合は無作為に100人を抽出してそのサンプルを「性別」と「…

身近な統計:株価と移動平均

身近な統計:株価と移動平均 本日のネット記事に、「移動平均線を見ればリーマンショックは回避できた!」というタイトルのものがあり、気になったのでチェックした。当方、米国のある業界の情報収集のモチベーションになるのではと思ってその業界数社の株は…

身近な統計:賃貸マンション家賃の決定要因は?

身近な統計:賃貸マンションの家賃の決定要因は?(回帰分析1) 7月1日に新しい路線価が発表された。最近の我が家の周辺の人口動向を見ても、首都圏では都心部への一極集中が加速しているようである。 自分も昨年より不動産賃貸を始めた。いろいろ調べたり実…

身近な統計(5):相関と因果

身近な統計(5):相関関係と因果関係 2つの変数間に相関関係があるからといって、その変数に対応する事象間に因果関係があるとは限らない。これはネット上でもさまざまな解説がなされている。問題はこのような相関関係と因果関係の混同が知識不足だけでなく意…

身近な統計(4):相関

身近な統計(4):相関 前回は学力テストデータを題材にしたので、しばらくその関連のテーマについて話をする。以下のデータは16名の架空の中学生の「数学」「理科」「英語」の試験の点数である。 以下の図は「数学」と「理科」の点数の関連性をみるための散布…

身近な統計(3):偏差値

身近な統計(その3):偏差値 一般的に用いられる統計処理として最も広く用いられているものに「偏差値」がある。 この基本となるデータ処理は、データが正規分布に従うと仮定した場合の「標準化」である。正規分布には2つのパラメータがある。一つは分布の…

身近な統計(2):箱ひげ図

身近な統計(その2):分布を見える化する「箱ひげ図」 時流に乗ってしばらくワールドカップねたで書いたが、グループリーグ終了後にもう一回書くこととして、身近な統計シリーズに戻る。 身近な統計(その1)で、以下の仮想データを用いて平均値と中央値を…

身近な統計(その1)平均値と中央値

身近な統計(その1):平均値と中央値 本日より、統計データ解析についての話をいたします。まずは、「身近な統計」シリーズです。不定期で他の話題を書くこともあります。 今回は、統計データを要約する手段としての「平均値」と「中央値」について考える。…