en arrière de l'élimination dans la régression logistique à l'aide de R

Je suis en cours d'exécution d'une régression logistique dans la R et de faire "marche arrière élimination" afinde pour obtenir mon modèle final:

FulMod2 <- glm(surv~as.factor(tdate)+as.factor(tdate)+as.factor(sline)+as.factor(pgf)
                                    +as.factor(weight5)+as.factor(backfat5)+as.factor(srect2)
                                    +as.factor(bcs)+as.factor(loco3)+as.factor(fear3)
                                    +as.factor(teats)+as.factor(preudder)+as.factor(postudder)
                                    +as.factor(colos)+as.factor(tb5) +as.factor(respon3)
                                    +as.factor(feed5)+as.factor(bwt5)+as.factor(sex)
                                    +as.factor(fos2)+as.factor(gest3)+as.factor(int3),
                                    family=binomial(link="logit"),data=sof)

Lorsque vous essayez d'exécuter l'arrière de l'élimination de script:

step(FulMod2,direction="backward",trace=FALSE)

J'ai eu ce message d'erreur:

Error in step(FulMod2, direction = "backward", trace = FALSE) : 
  number of rows in use has changed: remove missing values?

C'est le deuxième modèle que je suis en cours d'exécution à l'aide de l'arrière de l'élimination de la fonction. Le premier modèle était très bien quand je l'ai fait en arrière de l'élimination d'obtenir mon modèle final.

Toute aide serait grandement appréciée!

Baz

De ?step: Warning L'ajustement du modèle doit appliquer les modèles pour le même ensemble de données. Cela peut être un problème si il y a des valeurs manquantes et des R par défaut de na.action = na.omettre est utilisé. Nous vous suggérons d'enlever les valeurs manquantes en premier. Vous pourriez regarder ?complete.cases pour identifier complète et incomplète des cas dans sof.
Merci pour votre aide. J'ai 9000 dossiers et après l'application de "compléter.des cas", il est désormais passé à 8000. Je suis juste à penser, si c'est beaucoup, beaucoup trop à perdre? En tout cas, merci encore une fois!
Sur une autre note, si votre prédicteurs correspondent pour le reste des colonnes dans sof, vous pouvez utiliser le . opérateur pour ?formula de "spécifier toutes les colonnes qui n'est pas autrement nommé dans le modèle. Donc, quelque chose comme glm(surv ~ ., data sof, family = binomial(link = "logit")). Vous aurez envie de faire toutes les classes as.factor() à l'avance. Aussi, les deux premiers facteurs prédictifs as.factor(tdate)+as.factor(tdate) semblent identiques. Est-ce intentionnel?
Merci pour cela. Concernant les deux premiers prédicteurs de l'.facteur(tdate)+comme.facteur(tdate), il n'était pas intentionnel!

OriginalL'auteur baz | 2012-04-03