投資のためのデータサイエンス

個人の投資活動に役立つデータ分析にまつわる話題を綴ります。

データサイエンスのおすすめオンライン記事(8月22日付)

今年は猛暑が来るのが早かったが、やっと秋の気配が感じられるようになってきた。3年ぶりにバカンスを楽しんだという方も多かっただろう。 今回はすぐに使いまわしができる実用的な記事が多くなった。是非活用していただきたい。テンソルを用いたディープラ…

データサイエンスのおすすめオンライン記事(8月9日付)

先週久々に一泊二日の温泉旅行に行ったが、土日にもかかわらず新幹線はあまり混んでおらず、宿の部屋も空きが多かった。一人で大浴場を占領できてよかったが、コロナも早く下火になってもらいたいものである。 このところ記事のストックが膨大になってきたの…

データサイエンスのおすすめオンライン記事(7月22日付)

梅雨が早く明けた後に雨模様の天候が続いたりしているが、やはり蒸し暑い。外で活動するよりも涼しい部屋でパソコンとにらめっこしている方が快適ではある。 今回はチュートリアル記事が多めになった。涼しい部屋でこのよなチュートリアル記事を読みふけるの…

データサイエンスのおすすめオンライン記事(7月13日付)

前回投稿時から引き続き、デプロイ系の作業に忙殺されているうちに、また期間が空いてしまった。今回は前回とは対照的に、実用系の記事が揃った格好になっている。よりよいデータ保存法でPythonのパフォーマンスを改善する towardsdatascience.com 表形式の…

データサイエンスのおすすめオンライン記事(データサイエンスのための数学特集)

いよいよ本格的な夏も迫っていることを実感する暑さである。当方はこのところサーバーインフラ周りの作業に忙殺され、前回の投稿からかなり空いてしまった。 今回もチェックしておいた記事のストックを順に紹介するのだが、たまたま全部数学関係の記事になっ…

データサイエンスのおすすめオンライン記事(6月2日付)

相変わらず外出時にマスクは必須だが、それ以外はコロナは忘却の彼方という感がある。インバウンド観光客も少しずつ受入れが始まり、安全な旅行先として評価が高い日本ではまた遠からずインバウンド客の賑わいが戻ってくるであろう。 くしくも今回は「Python…

データサイエンスのおすすめオンライン記事(5月11日付)

コロナは大きな波の兆しもなく推移している。しかし経済面では、円安や米国株価の下落があり、ウクライナ情勢も混とんとしていることから先が見通しにくくなっている。 今回紹介する記事の中では辞書的に活用できる下2つの記事が特に目立っている。Pandasデ…

データサイエンスのおすすめオンライン記事(5月3日付)

ゴールデンウイークも中盤になっている。今年は日の並びもよく、しかもこの中盤は首都圏では天気もいい。観光地の人出もかなりコロナ前に戻っているということで、明るい材料が揃った感じである。今回はPython関連の記事を中心に紹介する。貴方のPythonコー…

データサイエンスのおすすめオンライン記事(4月13日付)

季節外れのぽかぽか陽気が続いている。しかし経済面ではロシア-ウクライナ戦争を契機に世界的なインフレと金融危機リスクの高まりで真冬への入り口という感じである。 今こそ知識や情報を十分に集めて時代の荒波を乗り越える主体的行動を取らなければならな…

データサイエンスのおすすめオンライン記事(4月3日付)

新年度に入った。先週末に近郊の桜の名所を少し歩いたが、いつもずらっと並んでいた露店が全くないのがやや寂しい感じがした。 今回は実際に読んで取り組んでみたいと思わせる良記事が揃った。お時間のある方は是非チェックしていただきたい。 (注:本ブロ…

図解データサイエンス特集(その2)

データサイエンスを理解あるいは実践する上で有用と思われる図解の画像は、引き続きツイッター上に投稿されている。 今回はそのような図解データサイエンスの第二弾をお届けする。 尚、前回と同じく、出典については各タイトルに貼られたリンクを参照してい…

データサイエンスのおすすめオンライン記事(3月16日付)

ウクライナ戦争は、第二次世界大戦後の「当たり前だった平和」の時代の転換を予兆しているかのようである。とりあえず日本政府は社会生活の根幹を支えるエネルギーの安定供給のための施策に全力を尽くしてもらいたい。いかにベイジアン機械学習は機能するか …

過去ブログのリニューアル:「統計学の基本数式」シリーズ

本ブログは過去の他形式のブログを取り込んで作成したため、数式の表示に不備があるものがありましたが、この度それらを修正し、「統計学の基本数式」シリーズとしてリニューアルしました。是非ご覧ください。(1) 平均値と期待値 datapowernow.hatenablog.co…

データサイエンスのおすすめオンライン記事(3月4日付)

欧州で戦争勃発など慌ただしい中、首都圏ではマンボウも延長されたが、街の賑わいは春を迎える準備を進めているように感じられる。新年早々は興味深いデータサイエンスの記事が少なかったが、春を告げるかのごとく最近一気に面白い記事が増えてきた。しかし…

データサイエンスのおすすめオンライン記事(2月11日付)

米国の名門エール大学でデータサイエンスを学ぶ学生でもあるフィギュアスケートのネイサン・チェン選手が下馬評通りの強さで冬季五輪金メダルを獲得した。 apnews.com 当方は日本でのイベントでチェン選手を間近に見ていたので感慨深いものがある。一見華奢…

図解データサイエンス特集

ツイッターの投稿には、他サイトへのリンクではなく一枚の「ポンチ絵」的な画像が投稿される場合も多い。これまで本ブログでは有用と思われるデータサイエンスに関するオンライン記事のみを紹介し、画像1枚のみのツイッター投稿はスキップしていた。しかし…

データサイエンスのおすすめオンライン記事(Python機械学習ライブラリ特集)

Pythonの機械学習ライブラリについては、これまで断片的に引用したり紹介したりしてきたが、包括的なまとめはしてこなかった。今回は、有名なライブラリについて順を追って学習できるチュートリアルサイトをとりまとめて紹介する。scikit-learnのチュートリ…

データサイエンスのおすすめオンライン記事(1月12日付)

年が明けてオミクロン株への感染が急拡大している。しかしこれは多くの識者が予測していたことであり、重症化率は低いので、再び過剰な行動規制をして経済を痛めつけるべきでないとの意見が多い。年末年始は繁華街の活気が戻ったと実感したが、これが再び沈…

データサイエンスのおすすめオンライン記事(1月2日付)

明けましておめでとうございます。様々な事業主体においてデータを活用して効率化を図ったり戦略的な意思決定に役立てるための科学的アプローチへのニーズはますます高まっています。本年もデータの統計的分析やデータサイエンスに携わる皆さんに少しでも役…

Python Dashによるダッシュボードの構築(改訂版)

【注記】最初に投稿したコードはGoogle Colaboratoryでは動作しますが、Dockerではエラーで動作しないものでした。ダッシュボードはデプロイしなければほとんど意味がなく、現状ではDocker環境がデプロイには最もよい方法と考えらるため、Dockerでエラーなく…

データサイエンスのおすすめオンライン記事(12月4日付)

「実質ゼロコロナ」で安心しかけたのもつかの間、「オミクロン株」の脅威に一喜一憂する日々となってしまった。ギリシャ文字が全部終わってもまだ新たな変異株が出現するのか?そうしたらどう名付けるのか?などど考えてしまう。今年も残すところ一ヶ月。来…

TF-IDFとコサイン類似度を用いたおすすめ文書の抽出

昨今のECサイトでは、リコメンド機能によりユーザがさらに買いたいと思うような商品を提案して顧客体験を向上させることが一般的になっています。この背景にある技術は、一つには日本語を自動的に品詞に分解して「わかち書き」にする技術(形態素解析)、も…

Dashによるwebアプリの構築の基礎

Pythonによってデータの分析をして得られたグラフなどのアウトプットについては、画像ファイルに保存して、Word文書やPowerPointのスライドに貼り付けて報告資料にする、というのが最も一般的でしょう。一方、実務ではエンドユーザが自ら分析したい変数や条…

データサイエンスのおすすめオンライン記事(11月4日付)

コロナ感染者もみるみるうちに「実質ゼロコロナ」といえるほどまで減少した。海外ではまだ多くの感染者を出している国もあり予断を許さないが、混雑した町並みや電車など、日常生活が戻ってきたと実感することが多くなった。 今回紹介する記事もストックにあ…

ログデータにおけるテキストデータ連続累積出現回数の算出

様々な活動を記録したログデータにおいて、あるパターンの文字列が何回連続して登場したかをカウントすることが必要になる場合があります。これは集計処理とは異なるため、コーディングは多少ややこしくなります。 ここでは例として、サッカーJリーグの歴代…

データサイエンスのおすすめオンライン記事(10月20日付)

先週「ワーケーションツアー」なるものに参加した。様々な所から集まった参加者が観光を楽しみつつ、ある時間帯にはPCに向かって仕事をするのは異様な感じもしたが、休暇を楽しみつつ会社ネットワークにつないで「置いてきぼり」にならないようにするにはい…

データサイエンスのおすすめオンライン記事(9月28日付)

事実上の次期首相を選ぶ選挙が翌日に迫ってきた。次のリーダーには是非長期的な視点で日本の経済的衰退を食い止める政策を打ってもらいたい。特にエネルギー政策は国の根幹に関わる重要課題であり、次期首相の政治家としての手腕に期待したい。 前回の投稿か…

Pythonによる分散分析のデモ

ある変量の変動の要因を分析する場合には、母集団のサブグループ別に分布や平均値を比較して、グループ間で差があるかどうかをみる、ということはよく行われます。これをより系統的に行う手法が分散分析です。分散分析は、原理的にはダミー変数を用いた回帰…

データサイエンスのおすすめオンライン記事(8月9日付)

前回のこのシリーズの投稿からバタバタしている間にオリンピックが終わってしまった。これは最近始まったことではないが、バレーボールではコーチがタブレット端末片手にデータ分析結果に基づいてリアルタイムに戦略を指南していたし、サッカーでも日本代表…

PythonによるECカタログデータの分析小技集(下)

前回に引き続き、「楽天ブックス書籍検索API」を利用してダウンロードした書籍情報データを用いて、ECサイトのカタログデータを処理・分析するためのpythonの小技をまとめました。 まず前回と同様に必要なライブラリを読み込み、データを保存先からロードし…