投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2014-01-01から1年間の記事一覧

スマートフォンとデータ読み解き

ここ最近、スマートフォンやタブレット端末がもたらすIT革命に関するビデオ講演を何回か繰り返し見た。 特に地方の農業でシニアの方々がタブレットを使って楽しそうに業務を行っている事例(徳島の「いろどり」)が印象的であった。 確かにその講演で言及さ…

統計まとめ(終)単位根過程・共和分とパネル分析

「統計まとめ」シリーズは今回で終了します。 また、「もっと知る統計」等、数式を使った解説も原則として今回で終了し、今後はより実践的なデータ読み解きに焦点を当てて書いていきます。 ぜひご期待下さい。 ところで、以下の記述の中に出てくる「ランダム…

統計まとめ:混合分布&たたみ込み

風邪で体調を崩して治った直後に、オフィシャルエコノミスト自らが「ねずみ講」と認める消費増税先送りと争点の見えない総選挙へ突入という事態になった。原発を止めて年間3兆円もの国富流出をしている国の経済が上向くとはとても思えないが、この点は専門家…

統計まとめ:因子分析(その1)

前回述べた主成分分析と因子分析は似たような目的で用いられることが多い。 基本的な違いは、主成分分析が観測された変数の線形結合を因子得点とするのに対して、因子分析は事前にいくつかの潜在因子を仮定したモデルをあてはめる。以下の図は因子分析の基本…

統計まとめ:主成分分析

6月25日の本ブログで、学校の英語と数学のテスト点数の散布図を示した。そこで、「基本的学力」のような潜在的な尺度(真の尺度ではなくあくまでも解釈上のもの)を見える化するために、「多変量解析」の諸手法が用いられることを述べた。 多変量解析につい…

統計まとめ:2つの「ウィルコクソン」検定

ノンパラメトリック統計の本には、通常「ウィルコクソン」を冠した2つの検定の説明がある。これらの検定はどちらも2つの母集団の分布が同一かどうかを検定するものである。しかしこれはこのような検定ツールをよく使う専門家でないと非常に紛らわしい。ネッ…

マクロ環境とミクロ行動(2)+まとめ統計「連続型分布の最尤推定量」

起業とリスク認識についてネット上で色々と調べていたら、YouTubeにいくつか興味深い動画があった。「起業する3大リスク」「サラリーマンを続ける3大リスク」は簡潔で的を得た解説だと思う。 本ブログの趣旨からいうと、「起業というミクロ行動に役立つよ…

マクロ環境とミクロ行動(1)+まとめ統計「離散型分布の最尤推定量」

8月19日の当ブログで、マクロ(経済)環境とミクロ行動(起業など)の関連についての問題意識について述べた。その後、ネット上のブログやサイトでいくつか関連した内容の記事を見つけた。 結局起業とは、リスクをとって自らの資金や時間を投資し、金銭的収…

もっと知る統計:効用と価格指数

我々が消費をするのは、空腹を満たすとか楽しみを得るといった「効用」を得るためである。 「近代経済学においては、物の価値を効用ではかる効用価値説を採用し、消費者の行動は、予算の制約の下で効用を最大にするように消費するとされる。また利潤の最大化…

身近な統計:消費者物価指数とラスパイレス指数

身近な統計:消費者物価指数とラスパイレス指数(1) 経済指標としてよくニュースなどで報じられるものに「消費者物価指数(CPI)」がある。これは消費者物価全体の水準が基準時点に対してどれくらい上下したかを表す指数である。この消費者物価指数の計算方式に…

スコットランド独立住民投票

スコットランド独立に関する住民投票の開票結果が間もなく明らかになる。 Yahoo!ニュースによれば、 「締め切り直後に発表された英世論調査会社YOUGOVが行った当日の世論調査によると、独立反対が54%で46%の賛成をリードしている。」 と書かれている。これ…

統計まとめ:積率と積率母関数

これまで本稿では統計解析のトピックについて場当たり的に書いてきたが、今後「まとめ」的な記述を加えたい。 尚、統計以外の話題は書くような題材がなかなか見つからなかった。来週は米国へ行くので、その報告をしたい。 今回は「積率」と「積率母関数」に…

もっと知る統計:ワルド検定とスコア検定

最尤推定量に関連した検定として、「ワルド検定」と「スコア検定」という検定がある。時たま見かける程度であるが、今回これらの検定統計量について整理してみた。大雑把なイメージは以下の図のようになる。 尚、前回登場した「尤度比検定」も一緒に論ずるべ…

もっと知る統計:I×J分割表と対数線形モデル

前回取り上げた2×2分割表をより一般化したものが、I×J分割表であり、さらにI×J×K分割表といったより高次元の分割表へ拡張される。このような分割表を分析するモデルとしては、以下に述べる「対数線形モデル」がある。私はこのモデルを学生時代に主と…

身近な統計:2×2分割表

身近な統計:2×2分割表 以下の集計表は調査対象の人々を「性別」と「利き腕」によってクロス分類した2×2分割表である(出典:ウィキペディア)。このような分割表はしばしばお目にかかる。 この場合は無作為に100人を抽出してそのサンプルを「性別」と「…

もっと知る統計:ノンパラメトリック検定問題

統計学において「ノンパラメトリック」とは特定の分布を仮定しないということであるが、どのようなものかはなかなか分かりにくい。 以前に例として取り上げたテストの得点の一部を抜粋し、以下に述べる「中央値の差の検定」を実施してみた。 明らかに英語の…

もっと知る統計:マクロ経済モデルにおける回帰(3)

最近、小規模起業家の人と会う機会があったが、そのような人達のほとんどは、マクロ経済のトレンドがどのようになっているかなどは気にせず、「ポジティブ思考で突っ走る」というスタイルで、現実にかなりの人が成果を出している。実際に自分がその立場なら…

もっと知る統計:マクロ経済モデルにおける回帰(2)

今更ではあるが、以下の3つのグラフを見ると、日本経済がバブル崩壊とともに失速し、その後の僅かな成長も多大な借金によって無理やり創造されているのではないか、という感を強くする(データ出典はいずれもIMF World Economic Outlook)。 上記のデータを…

もっと知る統計:マクロ経済モデルにおける回帰(1)

もっと知る統計:マクロ経済モデルにおける回帰(1) 昨日、今年度4月~6月期のGDP速報が発表された。消費税増税にともなう駆け込み需要の反動は当然予想されたが、それを考慮しても消費の低迷は気になるところである(下の図の出典は日経電子版)。 このGDPの…

もっと知る統計:多変量正規分布(2)

もっと知る統計:多変量正規分布(2) 多変量正規分布について復習をしていたら、前回よりもさらにややこしい課題があることがわかった。それはn個の観測値の総和が与えられたというもとでの、そのn個の変数の一部の条件付き分布である。前回のケースでは変数…

地方のベンチマーキング:新潟を訪問して

地方のベンチマーキング:新潟を訪問して 所用で新潟市を訪問した。新潟県にはスキーや出張で何度か行ったことがあったが、新潟市は初めてである。新幹線で新潟駅に降り着いたらやはり暑かった。 都道府県を様々な角度から定量的に評価する指標は色々とある…

もっと知る統計:多変量正規分布

もっと知る統計:多変量正規分布 このところ、データ読み解きの事例として使えそうな最近の話題が見つからないので、再びややこしい統計理論の整理を行うこととする。 今回取り上げるのは「多変量正規分布」である。2次元では下のような形をしている。 そも…

もっと知る統計:統計的検定(4)

もっと知る統計:統計的検定(4) 連日暑い中、統計的検定論に踏み込んでしまったが、今回で一応一区切りつけられる。 尚、前回まで事例として取り上げた「正規分布において分散が未知だが等しいと仮定した平均の差の検定」も「一様最強力普遍検定」になるとの…

もっと知る統計:統計的検定(3)

このシリーズは今回で3回目だが、仮説検定論に真正面から取り組むことになってしまった。 前回の例である1組と2組のテストの平均得点の差の検定(分散は未知だが等しいと仮定)のエクセルによる計算結果は以下の通りである。尚、これを実施するためには、あ…

もっと知る統計:統計的検定(2)

前回の記事で例として示した1組と2組のテストの得点の分布を箱ひげ図で示すと以下のようになる。 この2つの分布のようすから見て、実務的に、分散が等しいと仮定することは問題ないであろう。 そこで、このデータについては、「分散が未知だが等しい場合の正…

もっと知る統計:統計的検定(1)

もっと知る統計:統計的検定(その1) 今回は、「一様最強力不偏検定」について整理したい。しかしそのためには、「仮説検定」についてひと通りおさらいする必要がある。 例として、ある学校における2つのクラス(各40名)の、同じテストの得点が以下の通りで…

もっと知る統計:デルタ法

もっと知る統計:デルタ法 統計についてひと通り復習していると、「デルタ法」について書かれている書籍が意外と少ないので探すのに苦労した。そのため今回はデルタ法についてまとめておきたいと思う。 尚、デルタ法は下に書かれているようにあくまで近似で…

身近な統計:株価と移動平均

身近な統計:株価と移動平均 本日のネット記事に、「移動平均線を見ればリーマンショックは回避できた!」というタイトルのものがあり、気になったのでチェックした。当方、米国のある業界の情報収集のモチベーションになるのではと思ってその業界数社の株は…

テーマパークとベストプラクティス

当方、13日~14日の1泊2日でディズニーランドへ行った(正確にはディズニーシーに行かされた)。だが自分の関心はもっぱらビジネス面である。 日本のレジャー施設市場は東京ディズニーリゾートの一人勝ち状態になって久しい。2013年度売上高もオリエンタルラ…

もっと知る統計:回帰の分散分析

前々回、前回と同じく、賃貸マンション家賃の変動要因分析結果の表を示す。今回は、掲載し忘れていた重相関係数Rの値も追加した。 今回はこの表の下段の部分の数値について説明する。大抵の統計ソフトウェアには回帰分析機能でこの分散分析の表も表示される…