L'obtention d'Avertissement: “ 'newdata' a 1 rangée, mais les variables ont trouvé 32 lignes” à prévoir.lm
J'ai trouvé particularité lors de l'utilisation de prédire et lm fonction dans R. j'ai obtenu des résultats différents pour le bloc de données vectorielles et pour les mêmes données.
DataFrame code:
data(mtcars)
fitCar<-lm(mtcars$mpg~mtcars$wt)
predict(fitCar,
data.frame(x=mean(mtcars$wt)),
interval="confidence")
De sortie:
fit lwr upr
1 23.282611 21.988668 24.57655
2 21.919770 20.752751 23.08679
3 24.885952 23.383008 26.38890
4 20.102650 19.003004 21.20230
5 18.900144 17.771469 20.02882
6 18.793255 17.659216 19.92729
7 18.205363 17.034274 19.37645
8 20.236262 19.136179 21.33635
9 20.450041 19.347720 21.55236
10 18.900144 17.771469 20.02882
11 18.900144 17.771469 20.02882
12 15.533127 14.064349 17.00190
13 17.350247 16.104455 18.59604
14 17.083024 15.809403 18.35664
15 9.226650 6.658271 11.79503
16 8.296712 5.547468 11.04596
17 8.718926 6.052112 11.38574
18 25.527289 23.927797 27.12678
19 28.653805 26.519252 30.78836
20 27.478021 25.554415 29.40163
21 24.111004 22.715653 25.50635
22 18.472586 17.319886 19.62529
23 18.926866 17.799465 20.05427
24 16.762355 15.452833 18.07188
25 16.735633 15.423002 18.04826
26 26.943574 25.112491 28.77466
27 25.847957 24.198041 27.49787
28 29.198941 26.963760 31.43412
29 20.343151 19.242185 21.44412
30 22.480940 21.268498 23.69338
31 18.205363 17.034274 19.37645
32 22.427495 21.219818 23.63517
Message d'avertissement:
'newdata' a 1 rangée, mais les variables ont trouvé 32 lignes
Quand je m'en sépare à la fois des données dans le vecteur, j'ai eu réponse différente
Code pour vecteur
predict(fit,data.frame(x=mean(x)), interval="confidence")
De sortie:
fit lwr upr
1 20.09 18.99 21.19
Quelle est la raison de cette différence?
Vous devez vous connecter pour publier un commentaire.
C'est un problème de l'utilisation de différents noms de entre votre
data
et votrenewdata
et non pas un problème entre l'utilisation de vecteurs ou dataframes.Lorsque vous adapter à un modèle avec le
lm
fonction et ensuite utiliserpredict
de faire des prédictions,predict
essaie de trouver le même nom sur votrenewdata
. Dans ton premier cas, le nom dex
conflits avecmtcars$wt
et, par conséquent, vous obtenez le message d'avertissement.Voir ici une illustration de ce que je dis:
C'est ce que vous avez fait et ne pas obtenir une erreur:
Voir que dans ce cas vous adapter à votre modèle à l'aide du nom de x et également prévoir d'utiliser le nom de x dans votre
newdata
. De cette façon, vous n'obtenez pas de mises en garde et c'est ce que vous attendez.Voyons ce qui se passe lorsque je change le nom pour quelque chose d'autre quand je l'ajustement du modèle:
La seule chose que j'ai faite a été de changer le nom de
x
lors de la pose du modèle deb
et puis prédire en utilisant le nomx
dans lenewdata
. Comme vous pouvez le voir j'ai eu la même erreur que dans votre question.Espère que c'est clair maintenant!
install.packages("car") library(car) data(Quartet) lmfit = lm(Quartet$y2 ~ poly(Quartet$x,2,raw=TRUE)) newdata = data.frame(x = c(3,6,15)) predict(lmfit, newdata, interval = "confidence", level = 0.95)
Quartet$x
nom de prévoir également chercher ce dansnewdata
. Comme il n'y a pas deQuartet$x
dans newdata mais seulementnewdata$x
il échoue.Dans la formule pour le lm de la fonction ne renvoie pas à l'variables à l'aide de la datasetname$variablename modèle. Au lieu d'utiliser variablename + variablename ...Ce ne sera pas jeter l'avertissement: 'newdata' a nrow(test) ligne mais variables ont nrow(train) de lignes.
Un moyen de contourner cela sans faire de noms est d'utiliser les éléments suivants: