scikit-learnで決定係数等の予測値の当てはまりを計算することができるそうなのでやってみます。
決定係数(けっていけいすう、英: coefficient of determination、R2)は、統計学において、独立変数(説明変数)が従属変数(目的変数)のどれくらいを説明できるかを表す値である。寄与率と呼ばれることもある。標本値から求めた回帰方程式(モデル)のあてはまりの良さの尺度として利用される。
出典: フリー百科事典『ウィキペディア(Wikipedia)』
ちなみに明確な判断基準はないものの、大体以下のような感じらしいので目安にしてみたいと思います。
決定係数の値 | 判断 |
---|---|
0.9以上 | 非常に当てはまりがよい |
0.7以上0.9未満 | 当てはまりがよい |
0.5以上0.7未満 | あまり当てはまりはよくない |
0.5未満 | 当てはまりは悪い |
0.7以上だといいなぁ~。前回記事のソースコードに以下を追加して実行してみました。
# 平均絶対誤差 (MAE) # 決定係数 (R^2) from sklearn.metrics import r2_score print('決定係数 (R^2): %.3f' % r2_score(test_target, test_prediction))
どれくらいかなぁ♪の結果は、、
「決定係数 (R^2): -3.288」
ん?
んん??
マイナス???
ずば抜けて悪いって事?
当てにしたら人生破滅するで!って事?
な・・・なるほど。。
そりゃそうっすよね。
という事で、実に簡単に決定係数が出せる、という話でした。
コメント