先週久々に一泊二日の温泉旅行に行ったが、土日にもかかわらず新幹線はあまり混んでおらず、宿の部屋も空きが多かった。一人で大浴場を占領できてよかったが、コロナも早く下火になってもらいたいものである。
このところ記事のストックが膨大になってきたので、より重要と思われる記事は掲載の優先順位をあげて紹介することとした。
Pythonでいかに大規模データセットを扱うか
towardsdatascience.com
Pythonのデータ形式の比較の記事は7月13日付ブログでもとりあげたが、ここではCSV, Pickle, Parquet, Feather, HDF5の概要と書き込み速度などの特性の比較を行っている。
貴方のコードでよりよいコメントを書くための5つのコツ
towardsdatascience.com
データサイエンスではコードを単独で書くことが多いが、実務ではコードの可読性を高めることは重要である。ここではPythonでの上手なコメントの書き方を解説している。
貴方が知っておくべき6つの時系列予知的タスク
towardsdatascience.com
時系列データに特有ともいえる「予測」や「異常検知」など6つのタスクについて解説した入門記事。
データサイエンスのためのVS Code
towardsdatascience.com
Visual Studio Codeは今やコード開発の定番となったが、本記事はデータサイエンスのためのVS Codeの包括的なチュートリアル記事で内容も豊富となっている。
データ可視化でいかに「より考えないか」
www.freecodecamp.org
今回唯一Toward Data Science以外からの出典記事。Grammar of Graphicsのコンセプトを用いたPythonによるグラフ作成の解説。