投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

2021-01-01から1ヶ月間の記事一覧

スプレッドシートによるデータアナリティクス(3) 散布図の応用:トレンド線と点ラベルの表示

基本的な散布図を見ることにより、2つの特徴量の間にどのような関連があるかというイメージはつかめます。そうすると、典型的にはさらに次の2つのことが知りたくなります。(1) 2つの特徴量の関係を式で表すとどうなるか、あるいはX軸の特徴量を一単位増やす…

スプレッドシートによるデータアナリティクス(2) :2つの特徴量の関連性をみるための散布図

特徴量が一つの場合は、ヒストグラムによりその分布の様子を見ることが基本になりますが、特徴量が2つの場合は、その関連性を見ることが多くの場合必要になります。 例えば「気温と電力使用量との関連」を見るといった場合です。この場合の基本は「散布図」…

スプレッドシートによるデータアナリティクス(1):データの分布の様子を見るためのヒストグラム

本日より、新シリーズ「スプレッドシートによるデータアナリティクス」の連載をスタートします。 近年では「データアナリティクス」という言葉が流行っています。データアナリティクスとは一般的に、「顧客情報や購買履歴などのデータから事業改善や売上増加…

データサイエンスのおすすめオンライン記事(1月18日付)

年が明けて寒くなってきたのに伴いコロナが勢いを増してきて、再び緊急事態宣言となってしまった。ランチで飲食店に入ると帰るまで他の客がゼロということもあり、一体どれだけの店が生き残れるのかと陰鬱な気分になる。さて、本年も米国データサイエンスの…

Pythonで学ぶ統計学(10):予測のための時系列データの統計モデル化(ARIMAモデル)(その2)

前回紹介したARIMAモデルを実際の時系列データの予測に適用するpythonコードを紹介します。 時系列データの統計モデルによる予測は、現在では機械学習の一手法として紹介されることがほとんどとなっています。 ここでは機械学習コンペのサイトKaggleにあるデ…

Pythonで学ぶ統計学(10):予測のための時系列データの統計モデル化(ARIMAモデル)(その1)

時系列データの統計解析に関しては、2014年11月29日の本ブログの記事で、主として経済時系列を想定した単位根検定と共和分の話を書きました。ここでは、あらゆる分野の時系列データの予測のための統計モデル構築に利用されているARMAモデルあるいはARIMAモデ…

「データサイエンスと統計学の旅」ブログ発足にあたって

2014年からFC2ブログにて「データ読み解きナウ」というタイトルでブログを展開してきたが、2020年末に「はてなブログ」に移転し、タイトルを「データサイエンスと統計学の旅」とした。 読者がデータサイエンスと統計学の世界に足を踏み入れたら、旅行するか…