Tableau de Classification pour la régression logistique dans la R

J'ai un jeu de données composé d'un dichotomique selon la variable (Y) et 12 variables indépendantes (X1 à X12) stockées dans un fichier csv. Voici les 5 premières lignes de données:

Y,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12  
0,9,3.86,111,126,14,13,1,7,7,0,M,46-50  
1,7074,3.88,232,4654,143,349,2,27,18,6,M,25-30  
1,5120,27.45,97,2924,298,324,3,56,21,0,M,31-35
1,18656,79.32,408,1648,303,8730,286,294,62,28,M,25-30
0,3869,21.23,260,2164,550,320,3,42,203,3,F,18-24

J'ai construit un modèle de régression logistique à partir des données en utilisant le code suivant:

mydata <- read.csv("data.csv")     
mylogit <- glm(Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
               family="binomial")  
mysteps <- step(mylogit, Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
                family="binomial")

Je peux obtenir les probabilités prédites pour chaque données en utilisant le code:

theProbs <- fitted(mysteps)

Maintenant, je voudrais créer un tableau de classification en utilisant des 20 premières lignes du tableau de données (mydata) - à partir de laquelle je peux déterminer le pourcentage de la probabilité prédite qui fait d'accord avec les données. Notez que pour la variable dépendante (Y), 0 représente la probabilité est inférieure à 0,5 et 1 représente la probabilité est supérieure à 0,5.

J'ai passé de nombreuses heures à essayer de construire le classement sans succès. J'apprécierais beaucoup si quelqu'un suggérer code qui peut aider à résoudre ce problème.

Qu'en est table(theProbs>.5, mydata$Y) (il est facile de sous-ensemble sur les 20 premières observations)?
Merci un million de Chi. Je pense que c'est juste ce dont j'avais besoin. Encore merci et meilleures salutations.

OriginalL'auteur | 2012-09-05

cross-validation r

Question est un peu vieux, mais je me dis que si quelqu'un est à la recherche si les archives, cela peut aider.
Ceci se fait facilement en xtabs

classDF <- data.frame(response = mydata$Y, predicted = round(fitted(mysteps),0))

xtabs(~ predicted + response, data = classDF)

qui produira un tableau comme ceci:

           response
predicted   0   1
        0 339 126
        1 130 394

OriginalL'auteur bstockton

1

Je pense ronde " peut faire le travail ici.

(table ronde(theProbs))

OriginalL'auteur ohmyan

Vous devez vous connecter pour publier un commentaire.