À l'aide de lm et de prédire les données dans des matrices

- Je utiliser R seulement un peu, et de ne jamais utiliser des trames de données, ce qui rend la compréhension de l'utilisation correcte de prédire difficile. J'ai mes données dans la plaine de matrices, pas de trames de données, de les appeler a et b, qui sont N x p et M x p matrices respectivement. Je peux courir la régression lm(a[,1] ~ a[,-1]). Je voudrais utiliser le lm objet de prévoir b[,1] de b[,-1]. Mon naïf deviner de predict(lm(a[,1] ~ a[,-1]), b[,-1]) ne fonctionne pas. Quelle est la bonne syntaxe à utiliser le lm pour obtenir un vecteur de prédictions?

Ce n' doesn't work dire à votre question? Et pourquoi ne pas simplement utiliser data.frame'.
parce que je ne comprends pas comment utiliser data.frames. C'est la question. J'ai essayé quelques options plausibles de mettre mes trucs dans des trames de données, et qui n'a pas l'air de fonctionner. Je suis sûr que la réponse est très simple, je suis juste frustré de deviner au niveau de la syntaxe.
Veuillez faire votre exemple reproductible.
Vous avez essayé a <- as.data.frame( a )?

OriginalL'auteur pythonic metaphor | 2013-03-07

7

Vous pouvez stocker un ensemble de matrice à une colonne d'une data.frame:
```
x <- a [, -1]
y <- a [,  1]
data <- data.frame (y = y, x = I (x))
str (data)
## 'data.frame':    10 obs. of  2 variables:
## $ y: num  0.818 0.767 -0.666 0.788 -0.489 ...
## $ x: AsIs [1:10, 1:9] 0.916274.... 0.386565.... 0.703230.... -2.64091.... 0.274617.... ...

model <- lm (y ~ x)
newdata <- data.frame (x = I (b [, -1]))
predict (model, newdata) 
##         1         2 
## -3.795722 -4.778784 
```
Le papier sur le package pls, (Mevik, B.-H. et Wehrens, R. Le Package pls: en composantes Principales et de la Régression des moindres Carrés Partiels dans la R Journal d'un Logiciel Statistique, 2007, 18, 1 - 24.) explique cette technique.

Un autre exemple, avec un ensemble de données spectroscopiques (quinine fluorescence), est en vignette ("grippe") de mon colis hyperSpec.

OriginalL'auteur cbeleites
2

De faire data.fram's de votre matrices, il suffit de faire:
```
m = matrix(runif(100), 10, 10)
df = as.data.frame(m)
```
Et effectuer une régression linéaire:
```
lm_result = lm(V1 ~ V100, df)
predicted_values = predict(lm_result, b)
```
Ou de régression multiple:
```
lm_result = lm(V1 ~ V2 + V3 + V4, df)
predicted_values = predict(lm_result, b)
```
en supposant que les colonnes V1 - V4 sont présents dans b.

Mais comment voulez-vous de les généraliser à beaucoup de prédicteurs (OP cas)?
voir mon edit pour plus d'informations.
Vous pouvez créer la formule à la volée, par exemple as.formula(sprintf("V1 ~ %s", paste(names(df)[2:4], collapse = " + "))).
Mais en effectuant une régression linéaire avec des centaines de prédicteurs est douteux, vous êtes probablement à côté d'un beaucoup de bruit.
n'oubliez pas lm(V1~.) ...

OriginalL'auteur Paul Hiemstra
1

On peut calculer les prédictions manuellement:
```
> fit <- lm(a[,1] ~ a[,-1])
> fit$coefficients[1] + b[,-1] %*% fit$coefficients[-1]
     [,1]
[1,]    1
[2,]    2
[3,]    5
```
Ici, fit$coefficients[1] est l'ordonnée à l'origine, et fit$coefficients[-1] sont les remaning coefficients (et %*% est la matrice de la multiplication).

C'est l'approche que j'ai utilisé avant, mais je voulais essayer d'utiliser certaines des fonctionnalités de la fonction predict. Il est agréable et facile.
C'est rapide, mais le coût de ne pas avoir les cloches et de sifflets de predict (intervalles de confiance, la prédiction des intervalles).

OriginalL'auteur NPE

Vous devez vous connecter pour publier un commentaire.