よちよちpython

独習 python/Qpython/Pydroid3/termux/Linux

グラフ作成

【Matplotlib、Bokeh、Plotly】グラフライブラリ主要3種類で時系列折れ線グラフを描く

今回は、3種類のグラフ描画ライブラリMaplotlib、Bokeh、Plotlyで簡単な時系列データの折れ線グラフを描きます。 はじめに 前回 はFlaskとPandasを使って、データフレームから生成したテーブルをWebページに表示する簡単なアプリを作りました。 Pandasを使う…

【matplotlib】SVG形式ファイルのグラフを扱ってみる

久しぶりの投稿。あまりプログラミングしないといろいろ忘れる。リハビリがてら… 今回は、matplotlibを使ってSVG形式のファイルでグラフを保存させてみます。 ついでに、JPG形式のグラフでも保存し、2つの形式のファイルサイズを測定します。 matplotlibで…

厚労省のコロナ陽性者数データが変わったのでメモ

厚生労働省のオープンデータというページに置いてあったコロナのPCR検査の陽性者数のcsvファイルが、別のファイルに置き換わったのでメモしておきます。 変更前 ファイル名 : pcr_positive_daily.csv 2021/07/27で更新ストップ 変更後 ファイル名 : newly_co…

【folium】地図のマーカーpopupにAltairで作成したグラフを載せる

今回は、foliumで作成した地図のマーカーpopupにグラフを載せる方法メモ。 前回【folium】マーカーのPopupにWebページのリンクの貼り付け、TwitterやYouTubeなどを埋め込む - よちよちpythonの続きです。 グラフ描画にaltair(アルタイル)というライブラリ…

【matplotlib】年代別の年間死亡者数とコロナ死亡者数を棒グラフと円グラフで描く

今回は、年代別で新型コロナの死亡者数と年間の死亡者数をグラフの作成をしながら比較して見る。 matplotlibでの棒グラフと円グラフ、pandasでの積み上げ棒グラフの練習を兼ねて。 新型コロナは騒動当初から「重症化傾向や死亡者は高齢者、さらには基礎疾患…

【Pandas】都道府県別の人口統計(総務省統計局令和元年国勢調査)

今回は、都道府県別の人口を表と棒グラフにします。 内容的には、apply関数とlambda関数を使ってSeriesの文字列を加工している点と、棒グラフを描く方法と、大したことやってません。初心者向けです。 元のデータは総務省統計局のもので、令和元年の国勢調査…

【Numpyだけで単回帰分析】np.polyfit()とnp.poly1d()でコロナ検査数から陽性者数を予測する

np.polyfit()とnp.poly1d()でコロナ陽性者数を単回帰分析予測 今回は、コロナの検査数と陽性者数のデータから、Numpyを使って単回帰分析を行ってみます。久しぶりでやり方忘れてるので復習。 独立変数xを検査件数、目的変数yを陽性者数として回帰分析をし、 …

【Pandas】任意の教科数と人数の成績表から学力を平均的に指定数でクラス分けする

成績表をもとに学力が平均的になるようにグループ分けする最終回 成績表をもとに学力が平均化するようにグループ分けするシリーズ、今回は最終回。 任意の教科数と人数の入った成績表を指定クラス数に分け、バラツキ最小と最大のクラス分けを返す関数を作る…

新型コロナのデータを見る

新型コロナのデータ 2021-07-03まで どんな具合か久しぶりに見てみる。書き散らかしメモ。 目次 新型コロナのデータ 2021-07-03まで データファイル no.0 cases_total.csv no.1 current_situation.csv no.2 death_total.csv no.2.2 death_daily (death_tota…

【Numpy・Pandas・Scikit-learn】成績表からランダムにクラス分けしたバラツキ具合を標準偏差で確認する

標準偏差でクラス間のバラツキを見る 今回は、クラス分けしたグループ間のバラツキ具合を、標準偏差を用いて見ます。 5教科の成績表をもとに100人を4つにクラス分けする方法を考えています。1回目、2回目、3回目につづく、シリーズ4回目。 クラス分けをする…

【Scikit-learn】k-平均法(k-means)を使って成績表からおまかせクラス編成する

k-means法(k-平均法)による、お任せクラス編成 前回の投稿では、Pandasで学校のテストの成績表のようなものを適当に作り、その合計点を算出して順位付けを行いました。 また、Pandasのグラフ作成機能を使って、積み上げ棒グラフを作成しました。 その合計100…

【Pandas】成績表を順位付けし、積み上げ棒グラフを作成する

Pandasで成績表を順位付けし、df.plot.bar()で棒グラフを作成する 学校のテストの成績表のようなものを適当に作ります。その合計点を算出してPandasで順位付けを行います。 Pandasのグラフ作成機能を使って、積み上げ棒グラフを作成します。 【実行環境】 Wi…

【japanize-matplotlib】WSL-Ubuntuでmatplotlibの「豆腐」文字化け解消法

WSL:Ubuntuでのmatplotlibを日本語化 グラフ作成ライブラリmatplotlibのデフォルト設定では、タイトルやラベルなどを日本語で書くといわゆる「豆腐」と言われる文字化けで上手く表記できません。 「豆腐」文字化けを解消する方法として色んなサイトや本で解…

【matplotlib】縦2軸の折れ線グラフの描き方2_コロナ陽性者_死亡者

こちらで折れ線グラフの縦2軸の描き方が分かったので、調子に乗ってもう一個書いてみた。 【実行環境】 Windows10 WSL:Ubuntu Jupyter Notebook Python3.8 外部ライブラリ pandas numpy matplotlib import pandas as pd import numpy as np import matplotli…

【matplotlib】左右に軸があるグラフを描く

今回は、matplotlibで左右に軸があるグラフを作成します。 実行環境 Windows10 WSL:Ubuntu Anaconda VScodeでjupyter拡張 Python3.8 外部ライブラリ pandas 1.1.3、matplotlib 3.3.2 使用データファイル 厚生労働省オープンデータのPCR陽性者数、PCR検査実施…

【matplotlib】時系列グラフ横軸目盛りの塗り潰れ解消法

今回は、時系列データグラフにおいて日付フォーマットや表示を変更する方法。 matplotlibで折れ線グラフを描いたとき、横軸の文字が重なって塗り潰れることがあります。 時系列データの横軸(日付)に限定ですが、日付を短く表示しそれを解消する方法のメモ…

【Pandas resample()】月別集計、時系列データを期間ごとに集計する方法

「売上データを月別で集計したい!」 というケースはよくありますよね。 今回は、Pandasを使って時系列データを週や月や四半期など期間ごとに集計する方法をやります。 実験室のセンサーや天候観測、売上やコロナのデータのように、秒単位や日毎で何らかのデ…

【Pandas】移動平均の出し方

今回は、Pandasで移動平均というものを出す方法。簡単です。 株価や新型コロナPCR検査数のグラフのように、日によって激しく上下するグラフをデータそのままで描くと、トレンドとして上がり調子なのか下がり調子なのか分かりにくくなる。そのため縦軸の値を…

【Pandas】新型コロナ年齢別死亡者数の棒グラフ作成

新型コロナの年齢別死亡者数を簡単にグラフ化します。 PythonとPandasの練習とメモ。 実行環境 Android Termux(ターミナルアプリ Python3.9 JupyterNotebook 外部ライブラリ Pandas、matplotlib 目次 実行環境 目次 データの入手 Excelファイルのダウンロー…

【Pandas】コロナのグラフ作成

はじめに 厚生労働省が公表している日本における新型コロナの各種データを、Pythonを用いてPandasの練習を兼ねてグラフ作成する。 ・グラフ作成に利用する元データのURLは、下記のコード内の先頭に書いています。 ・データの日付は、2021年1月3日が最新。開…

新コロナグラフ 8月25日更新日 厚労省オープンデータ

オープンデータ|厚生労働省のデータで作った新型コロナのグラフを上げます。 注意 グラフの目盛りについて グラフをアップしたら目盛りやタイトルが表示されていない… matplotlibのplt.savefig()で拡張子を省略したファイル名で保存したら自動的にpngの拡張…

新コロ・国別死亡者数

新型コロナの国別の合計死亡者数グラフを作りました。 データファイルはCSVでコチラ url = "https://opendata.ecdc.europa.eu/covid19/casedistribution/csv" EUの新型コロナのサイトから。 COVID-19 Coronavirus data - Datasets 見にくいですが… コードも…

新コロ陽性率

暇つぶしに陽性率を計算します。 陽性率 = 陽性者数 / 検査人数 データ取り込み import numpy as np import matplotlib.pyplot as plt import pandas as pd urls = [ "https://www.mhlw.go.jp/content/pcr_positive_daily.csv", #陽性者数 "https://www.mhlw…

陽性者数の回帰式を求める42万人チャレンジ

西浦チャレンジ! 新型コロナの予測において、学者は微分方程式を立てて、それを解いて出しているようですが、ここでは厚労省の陽性者数のデータを用いて描いたグラフの単回帰分析から回帰曲線を出し、そこで得られる陽性者数の予測に致死率を掛けて、最悪ケ…

PandasとNumpyでの相関関係の出し方

相関関係について。 NumpyとPandasを使ったそれぞれの方法。 目次 目次 相関関係とは 相関係数とは Pandasでの相関係数の出し方 グラフで見てみる 方法1: df.corr() 3列でも出来るか確認しておきます。 方法2: SeriesA.corr(SeriesB) Seriesではなくリストで…

【クラスの書き方練習】厚労省コロナデータを使ったグラフ作成

クラスの書き方を、グラフ作成で練習します。 正しい書き方なのかどうか分かりません。やったら動いたのでw クラス内のメソッドから、同一クラス内の別メソッドを実行する方法を学びます。 先に、こちら→オープンデータ|厚生労働省 に置いてある新型コロナ…

厚労省新型コロナ7月27日迄のデータによるグラフ作成

厚労省のサイト オープンデータ|厚生労働省 に掲載の新型コロナのデータCSVファイルからグラフを作成します。 7/28更新で27日までのデータが配信されております。 前回は7/22までのデータ 厚労省の新型コロナデータでグラフ作成 - よちよちpython 目次 目次…

厚労省の新型コロナデータでグラフ作成

半年ぶりの投稿。 モジュールの使い方等いろいろ忘れているので調べながら思いだしつつ。 この投稿では、厚労省のサイトオープンデータ|厚生労働省 に置いてある新型コロナのデータセットcsvファイルをそのまま用いてグラフを描いてみます。 目次 目次 実行…

Numpyだけで回帰分析その3。poly1d()について

今回は、これまでNumpyだけで回帰分析(単回帰)するときに使ってきたpolyfit()とpoly1d()のうちのpoly1d()にしぼって軽くみていく。 なお、回帰分析の数学的説明、poly1d()のプログラムのアルゴリズム的な説明等は一切ありません。全然理解していません。 参…

matplotlibで三次元立体グラフを描くテスト

グラフ描画用のPythonモジュールmatplotlibで三次元の立体的なグラフの描き方を学ぶ。写経とも言われる。 説明等は無し。 実行環境 Androidスマホ termux Python3.8 JupyterNotebook from mpl_toolkits.mplot3d import Axes3D import matplotlib.pyplot as p…