よちよちpython

独習 python/Qpython/Pydroid3/termux/Linux

【リンク メモ】YouTube動画。Python/JupyterNotebook/sklearnによる機械学習。回帰分析とロジスティック回帰

Able Programming
機械学習】線形回帰(前編)
https://youtu.be/zo8BmIGSO2Y



Able Programming
機械学習】線形回帰(後編) 重回帰と正則化
https://youtu.be/xh1OtbZyxqw



Able Programming
機械学習】ロジスティック回帰(前編)
https://youtu.be/mMMzDFttZ8A



Able Programming
機械学習】ロジスティック回帰(後編)多項ロジスティック回帰
https://youtu.be/KXE8fTlF44s



線形回帰分析な前編では身長を体重から予測する時のモデルづくりを例に説明されてある。
身長と体重はほぼ一次方程式的に正比例の関係がある。体重2トンで身長50センチみたいな人間はいないわけです。ある程度の分布に収まる。分布から一次方程式を導きだして予測しようとするのが線形回帰。
線形回帰後編では、データ群から予測に関係があると思われるパラメータを自動的に取り出し分析する方法。ある人物のデータな中で髪の毛の長さが身長に影響を与えると考える人は居ないと思うが、様々なデータなどれが関数にどれぐらい影響があるかを感覚で見付けるのはなかなか難しいわけです。
名前の画数で人生の運命を断定してしまう占いみたいに「そんなの関係なくね?」というような例が身近にあるのですが、たて髪の長さは競走馬の着順に影響するんだろうか?空気抵抗が増してスピードが落ちるとか?競泳の水着の素材や表面の形状は本当に結果に影響してるのか?カーレースのタイヤの素材や溝の形状、ウイングの角度たダウンフォースの適切な具合はどうすべき?といった多様なデータの中から本当に重要なパラメータを探らなければ的外れなデータ分析にしかならない。そこをどうやるかが後編。

ロジスティック回帰は確率の考え方を導入する。体重から服のサイズを予測する例から始まる。服のサイズはS,M,Lのように数字ではなく、仮に1,2,3のような数値に擬似的に置き換えたとしても、身長と体重のように連続した実数の値にはなっていない。そこで確率の分布を考えて分析しようというもの。
競馬の着順を予想する場合、どのパラメータが着順にどのぐらい影響を与えてどのぐらいの確率で何位でゴールするかを見ていくんだろう。ロジスティック回帰の理解が必要かな、知らんけど。



競馬に全く興味なかった頃には考えもしなかったが、馬の顔つきってみんな違うのね。性格も全然違う。
人懐っこくて可愛らしい顔した人気馬のレッツゴードンキちゃんが本日で引退だそうです。お疲れ様でした。以上

追記 ドンキちゃん3着!