scikit-learn valeur de retour de LogisticRegression.predict_proba

Exactement ce que fait le LogisticRegression.predict_proba de retour de la fonction?

Dans mon exemple, j'obtiens un résultat comme ceci:

[[  4.65761066e-03   9.95342389e-01]
 [  9.75851270e-01   2.41487300e-02]
 [  9.99983374e-01   1.66258341e-05]]

D'autres calculs, à l'aide de la fonction sigmoïde, je le sais, que la deuxième colonne sont les probabilités. Le la documentation dit, que la première colonne sont n_samples, mais qui ne peut pas être, parce que mes échantillons sont des examens, qui sont des textes et non des nombres. La documentation dit aussi, que la deuxième colonne sont n_classes. Qui ne peut certainement pas être, puisque je n'ai que deux classes (à savoir +1 et -1), et la fonction est censé être sur le calcul des probabilités des échantillons vraiment être d'une classe, mais pas les classes elles-mêmes.

Qu'est-ce que la première colonne vraiment et pourquoi il est là?

OriginalL'auteur Zelphir | 2016-04-17

30
```
4.65761066e-03 + 9.95342389e-01 = 1
9.75851270e-01 + 2.41487300e-02 = 1
9.99983374e-01 + 1.66258341e-05 = 1
```
La première colonne est la probabilité que l'entrée a la -1 de l'étiquette et de la deuxième colonne est la probabilité que l'entrée a la +1 étiquette.

Si vous souhaitez obtenir des probabilités prédites pour le positif uniquement sur l'étiquette, vous pouvez utiliser logistic_model.predict_proba(data)[:,1]. Cela permettra de vous céder la [9.95342389e-01, 2.41487300e-02, 1.66258341e-05] résultat.

Je suis totalement ne savais pas que! Merci pour la clarification rapide. Je me demande maintenant plus qu'avant ce que la documentation est en train de parler.
La documentation indique les éléments suivants: retourne la probabilité de l'échantillon pour chaque classe dans le modèle. @Zelphir: vous l'avez vu dans les docs: [n_samples, n_classes]. Cela renvoie à la sortie: il sera de retour une matrice, où les lignes sont les échantillons, et les colonnes les classes (-1, 1). Comme Iulian dit: vous obtiendrez pour chaque ligne une probabilité de prédiction pour la classe de -1 et une probabilty pour la classe 1.
Ah merci, je comprends maintenant la structure.
Comment vérifier l'ordre des classes? Je veux dire, comment savez-vous que la première colonne est la probabilité de la classe de -1?
Est-il un moyen de déterminer la probabilité de score à l'échantillon de la probabilité pour les classes?

OriginalL'auteur iulian

Vous devez vous connecter pour publier un commentaire.