scikit-learn valeur de retour de LogisticRegression.predict_proba
Exactement ce que fait le LogisticRegression.predict_proba
de retour de la fonction?
Dans mon exemple, j'obtiens un résultat comme ceci:
[[ 4.65761066e-03 9.95342389e-01]
[ 9.75851270e-01 2.41487300e-02]
[ 9.99983374e-01 1.66258341e-05]]
D'autres calculs, à l'aide de la fonction sigmoïde, je le sais, que la deuxième colonne sont les probabilités. Le la documentation dit, que la première colonne sont n_samples
, mais qui ne peut pas être, parce que mes échantillons sont des examens, qui sont des textes et non des nombres. La documentation dit aussi, que la deuxième colonne sont n_classes
. Qui ne peut certainement pas être, puisque je n'ai que deux classes (à savoir +1
et -1
), et la fonction est censé être sur le calcul des probabilités des échantillons vraiment être d'une classe, mais pas les classes elles-mêmes.
Qu'est-ce que la première colonne vraiment et pourquoi il est là?
OriginalL'auteur Zelphir | 2016-04-17
Vous devez vous connecter pour publier un commentaire.
La première colonne est la probabilité que l'entrée a la
-1
de l'étiquette et de la deuxième colonne est la probabilité que l'entrée a la+1
étiquette.Si vous souhaitez obtenir des probabilités prédites pour le positif uniquement sur l'étiquette, vous pouvez utiliser
logistic_model.predict_proba(data)[:,1]
. Cela permettra de vous céder la[9.95342389e-01, 2.41487300e-02, 1.66258341e-05]
résultat.La documentation indique les éléments suivants: retourne la probabilité de l'échantillon pour chaque classe dans le modèle. @Zelphir: vous l'avez vu dans les docs: [n_samples, n_classes]. Cela renvoie à la sortie: il sera de retour une matrice, où les lignes sont les échantillons, et les colonnes les classes (-1, 1). Comme Iulian dit: vous obtiendrez pour chaque ligne une probabilité de prédiction pour la classe de -1 et une probabilty pour la classe 1.
Ah merci, je comprends maintenant la structure.
Comment vérifier l'ordre des classes? Je veux dire, comment savez-vous que la première colonne est la probabilité de la classe de -1?
Est-il un moyen de déterminer la probabilité de score à l'échantillon de la probabilité pour les classes?
OriginalL'auteur iulian