投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2018-05-01から1ヶ月間の記事一覧

統計学の基本数式 (6) 中心極限定理

大数の法則では算術平均が分布の期待値に近づいていくことが示された。n個の観測値の和をnで割ると一点に収束していくが、収束するまでの分布はどのような形になっているであろうか?n個の観測値の和をnの平方根で割った場合は、元の分布がどのようなもので…

データサイエンスのおすすめウェブサイト(5/31)

これまで50以上のウェブサイトを紹介してきた。そろそろ整理をしないと、同じページを二度紹介したりすることが起きてくる。しかし興味深いページはまだまだ尽きない。 ・Pythonの5大統合開発環境 Pythonプログラマ、開発者向けの主要IDEの紹介。Pycharm, VI…

データサイエンスのおすすめウェブサイト(5/28)

先日中国のアリババグループの現状についての話を聞く機会があった。売上額の巨大さ、ライフスタイルの全てをカバーする多角化は凄まじいものがある。データサイエンス技術者も千人規模で活躍しているようである。 今回も気になったサイトを紹介する。 ・Pyt…

データサイエンスのおすすめウェブサイト(5/25)

相変わらず、「データサイエンス」というバズワードだけを追いかけているきらいがあるが、もうしばらく継続して紹介していきたいと思う。 ・データサイエンスと機械学習の包括的情報源 おなじみVincent Granville氏によるまとめ。これまでこの種のまとめサイ…

統計学の基本数式 (5) モーメント母関数

中心極限定理へ進む前に、モーメント母関数について記述しておく必要がある。 確率変数Xが与えられたとき、その確率密度関数をf(x)とする。以下の量(ここでは連続の確率変数とする): は、Xのk次モーメントと呼ばれる。 「モーメント母関数」は、確率変数X…

データサイエンスのおすすめウェブサイト(5/22)

今回はテクニカルでなく実務面での記事4件を紹介する。 ・Kirk Borne氏インタビュー「ビッグデータが解決の役に立たない問題はない」 学生などこれから本格的にデータサイエンスを学ぼうという人向けの話。過去の経験やデータサイエンスの今後について。 ・…

データサイエンスのおすすめウェブサイト(5/17)

前回までのフォロー対象者の絞り込みの結果、現在はKirk Borne氏のみをフォローしているが、ツイート数は多く、興味深い記事も多い。数が多くなったが紹介したい。 ・社会貢献のためのデータサイエンスとAIの力 Kirk Borne氏自身による記事。社会に貢献するA…

統計学の基本数式 (4) 大数の弱法則

チェビシェフの不等式 において、であると考える。ここで各xは互いに独立で同一の分布に従うとする。この場合の期待値は以下のようになる。 また分散は、互いに独立であることから異なる添え字の変数間の共分散がゼロとなるため、以下のようになる。 期待値…

データサイエンスのおすすめウェブサイト(5/11)

10名のトップデータサイエンティストをフォローすることから始めたが、その中で日本人に有用な記事を紹介してくれるのは、事実上Kirk Borne氏のみであることがわかった。この週末にさらにフォローすべき別の人物を探索しようと思う。 前回から日数が経過した…

データサイエンスのおすすめウェブサイト(5/5)

本日は天候も良く蒸し暑くもなかったので、ウォーキングで自宅近郊の市立庭園を散策した。このゴールデンウィークは天候に恵まれ、今日で3回目の屋外散策となった。 今回紹介するデータサイエンスのウェブサイトはややニッチなものが揃っている。ツイートで…

統計学の基本数式 (3) チェビシェフの不等式

「平均値」がなぜ重要かといえば、サンプルサイズが大きくなると算術平均が期待値に近づくという「大数の法則」があるからといえよう。 その大数の法則の証明など統計の要所で用いられるのが「チェビシェフの不等式」である。 正規分布では、平均プラスマイ…

データサイエンスのおすすめウェブサイト(5/2)

10名の著名データサイエンティストをtwitter上でフォローし始めて2週間あまりが経過した。その中で、日本のデータサイエンスに関わる者にとって有用な情報を発信してくれる人がかなり絞り込めてきた。これまでに本ブログで紹介したサイトの大部分の発信源は…