scikit-learnによるBoatRace予測値の当てはまり

scikit-learnで決定係数等の予測値の当てはまりを計算することができるそうなのでやってみます。

決定係数(けっていけいすう、英: coefficient of determination、R2)は、統計学において、独立変数(説明変数)が従属変数(目的変数)のどれくらいを説明できるかを表す値である。寄与率と呼ばれることもある。標本値から求めた回帰方程式(モデル)のあてはまりの良さの尺度として利用される。
出典: フリー百科事典『ウィキペディア(Wikipedia)』

ちなみに明確な判断基準はないものの、大体以下のような感じらしいので目安にしてみたいと思います。

決定係数の値判断
0.9以上非常に当てはまりがよい
0.7以上0.9未満当てはまりがよい
0.5以上0.7未満あまり当てはまりはよくない
0.5未満当てはまりは悪い

0.7以上だといいなぁ~。前回記事のソースコードに以下を追加して実行してみました。

# 平均絶対誤差 (MAE)
# 決定係数 (R^2)
from sklearn.metrics import r2_score
print('決定係数 (R^2): %.3f' % r2_score(test_target, test_prediction))

どれくらいかなぁ♪の結果は、、

「決定係数 (R^2): -3.288」

ん?

んん??

マイナス???

ずば抜けて悪いって事?
当てにしたら人生破滅するで!って事?

な・・・なるほど。。
そりゃそうっすよね。

という事で、実に簡単に決定係数が出せる、という話でした。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)