Comment est calculée la valeur R2 dans Scikit?

La R^2 et la valeur retournée par scikit learn (metrics.r2_score()) peut être négatif. Le docs dire:

"Contrairement à la plupart des autres scores, R2 score peut être négatif (il n'a pas besoin d'
en réalité le carré de la quantité R)."

Cependant la article de wikipedia sur R^2 ne mentionne pas de R (pas carré) de la quantité. Peut-être qu'il utilise les différences absolues au lieu des carrés des différences. Je n'ai vraiment aucune idée

source d'informationauteur joeally

21

La R^2 dans scikit learn est essentiellement le même que ce qui est décrit dans l'article de wikipedia sur le coefficient de détermination (grep pour "la définition la plus générale"). Il est 1 - residual sum of square /total sum of squares.

La grande différence entre un classique stats de réglage et de ce que vous essayez habituellement à voir avec l'apprentissage de la machine, c'est que dans l'apprentissage de la machine-vous évaluer votre score sur invisible de données, ce qui peut conduire à des résultats à l'extérieur [0,1]. Si vous appliquez R^2 les mêmes données que vous avez utilisées pour s'adapter à votre modèle, il se situer à l'intérieur de [0, 1]

Voir aussi ce question très semblable
1

Depuis R^2 = 1 - RSS/TSS, le seul cas où RSS/TSS > 1 se produit lorsque notre modèle est encore pire que le pire modèle suppose (ce qui est l'absolu du modèle).

ici RSS = somme des carrés de la différence entre les valeurs réelles(yi) et les valeurs prédites(yi^)
et TSS = somme des carrés de la différence entre les valeurs réelles (yi) et la valeur moyenne (Avant l'application de la Régression).
Vous pouvez donc imaginer TSS représentant le meilleur(réelle) du modèle, et RSS être entre notre modèle et le pire absolu modèle auquel cas nous aurons RSS/TSS < 1.
Si notre modèle est encore pire que le pire moyen modèle, alors dans ce cas RSS > TSS(vu que la différence entre l'observation réelle et la valeur moyenne < différence de la valeur prédite et l'observation réelle).

Vérifier ici pour mieux l'intuition à la représentation visuelle: https://ragrawal.wordpress.com/2017/05/06/intuition-behind-r2-and-other-regression-evaluation-metrics/

Vous devez vous connecter pour publier un commentaire.