投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2020-02-01から1ヶ月間の記事一覧

Pythonで学ぶ統計学(5): 同時確率分布

データ解析の実務で複数のデータを扱うことは頻繁にあります。例えば気温とアイスクリームの売上高の関係を分析したい場合は、この2つの項目に対応する2つの確率変数の「同時確率分布」を考えます。 連続量の場合、2つの確率変数と定数について、同時確率…

データサイエンスのおすすめウェブサイト(2月19日付)

前回投稿時から変わらずコロナウィルスが猛威をふるっている。インバウンドの減少やサプライチェーンの停滞など経済に与える影響は相当大きくなるだろう。人混みの場所へ出かけることを考えずにじっとして足元を固めた方がよさそうである。今回も最近目につ…

Pythonで学ぶ統計学(4): 連続型確率分布(その2)

まず、以下の確率密度関数を持つ分布を「ガンマ分布」といいます。 ここでは正の値をとるパラメータで、は以下で表される「ガンマ関数」です。 ガンマ分布で特にの時は指数分布に一致し、の時は自由度のカイ自乗分布に一致します。 次に、開区間(0,1)で定義…

Pythonで学ぶ統計学(3): 連続型確率分布(その1)

連続型の確率分布で最も基本的なものは、区間 ]で一定の確率密度を持つ「一様分布」です。 上記の一様分布はある値の区間内であればどの値も同程度の確率で起こるというものですが、我々の身近にある数量の分布、例えば「ある中学校の1年生男子生徒の身長の…