en arrière de l'élimination dans la régression logistique à l'aide de R
Je suis en cours d'exécution d'une régression logistique dans la R et de faire "marche arrière élimination" afinde pour obtenir mon modèle final:
FulMod2 <- glm(surv~as.factor(tdate)+as.factor(tdate)+as.factor(sline)+as.factor(pgf)
+as.factor(weight5)+as.factor(backfat5)+as.factor(srect2)
+as.factor(bcs)+as.factor(loco3)+as.factor(fear3)
+as.factor(teats)+as.factor(preudder)+as.factor(postudder)
+as.factor(colos)+as.factor(tb5) +as.factor(respon3)
+as.factor(feed5)+as.factor(bwt5)+as.factor(sex)
+as.factor(fos2)+as.factor(gest3)+as.factor(int3),
family=binomial(link="logit"),data=sof)
Lorsque vous essayez d'exécuter l'arrière de l'élimination de script:
step(FulMod2,direction="backward",trace=FALSE)
J'ai eu ce message d'erreur:
Error in step(FulMod2, direction = "backward", trace = FALSE) :
number of rows in use has changed: remove missing values?
C'est le deuxième modèle que je suis en cours d'exécution à l'aide de l'arrière de l'élimination de la fonction. Le premier modèle était très bien quand je l'ai fait en arrière de l'élimination d'obtenir mon modèle final.
Toute aide serait grandement appréciée!
Baz
De
Merci pour votre aide. J'ai 9000 dossiers et après l'application de "compléter.des cas", il est désormais passé à 8000. Je suis juste à penser, si c'est beaucoup, beaucoup trop à perdre? En tout cas, merci encore une fois!
Sur une autre note, si votre prédicteurs correspondent pour le reste des colonnes dans
Merci pour cela. Concernant les deux premiers prédicteurs de l'.facteur(tdate)+comme.facteur(tdate), il n'était pas intentionnel!
?step
: Warning L'ajustement du modèle doit appliquer les modèles pour le même ensemble de données. Cela peut être un problème si il y a des valeurs manquantes et des R par défaut de na.action = na.omettre est utilisé. Nous vous suggérons d'enlever les valeurs manquantes en premier. Vous pourriez regarder ?complete.cases
pour identifier complète et incomplète des cas dans sof
.Merci pour votre aide. J'ai 9000 dossiers et après l'application de "compléter.des cas", il est désormais passé à 8000. Je suis juste à penser, si c'est beaucoup, beaucoup trop à perdre? En tout cas, merci encore une fois!
Sur une autre note, si votre prédicteurs correspondent pour le reste des colonnes dans
sof
, vous pouvez utiliser le .
opérateur pour ?formula
de "spécifier toutes les colonnes qui n'est pas autrement nommé dans le modèle. Donc, quelque chose comme glm(surv ~ ., data sof, family = binomial(link = "logit"))
. Vous aurez envie de faire toutes les classes as.factor()
à l'avance. Aussi, les deux premiers facteurs prédictifs as.factor(tdate)+as.factor(tdate)
semblent identiques. Est-ce intentionnel?Merci pour cela. Concernant les deux premiers prédicteurs de l'.facteur(tdate)+comme.facteur(tdate), il n'était pas intentionnel!
OriginalL'auteur baz | 2012-04-03
Vous devez vous connecter pour publier un commentaire.
Afin d'exécuter avec succès
step()
sur votre modèle vers l'arrière la sélection, vous devez supprimer le cas danssof
avec des données manquantes dans les variables à tester.Dans votre commentaire, vous avez mentionné que 1 de 9 cas de données manquantes. Cependant, je vous recommandons de vérifier que de nouveau, avec le code ci-dessus, dans le cas où une partie de cette absence correspond à des variables non incluses dans
FulMod2
. Si vous avez encore de nombreuses incomplète cas, vous pouvez décider a priori si vous pouvez éliminer certaines des variables à forte absence.OriginalL'auteur BenBarnes