La Régression linéaire de la boucle pour chaque variable indépendante individuellement contre dépendante

Je veux comprendre comment créer une boucle ou en utilisant l'un de l'appliquer de fonctions pour obtenir l'individu 1:1 de régression de l'information pour chaque variable dans un dataset par rapport à la variable dépendante.

Permet de dire que je suis en utilisant mtcars. Comment pourrais-je écrire dans la R code qui prend chaque variable dans le bloc de données et régresse contre MPG?

Même mieux serait de se faire un résumé de chaque variable indépendante et avoir une sorte d'affectation de nom tels que x1=, x2=etc

summary(lm(mpg~eachvar,data=mtcars))

Un non-approche standard pour résoudre ce problème: Rapide par paires simple régression linéaire entre les variables dans un bloc de données. Le general_paired_simpleLM pourrait être utile lors de tous vos variables sont numériques.

OriginalL'auteur runningbirds | 2014-07-30

r statistics

Hi essayer quelque chose comme ça :

models <- lapply(paste("mpg", names(mtcars)[-1], sep = "~"), formula)
res.models <- lapply(models, FUN = function(x) {summary(lm(formula = x, data = mtcars))})
names(res.models) <- paste("mpg", names(mtcars)[-1], sep = "~")
res.models[["mpg~disp"]]


# Call:
# lm(formula = x, data = mtcars)

# Residuals:
#     Min      1Q  Median      3Q     Max 
# -4.8922 -2.2022 -0.9631  1.6272  7.2305 

# Coefficients:
#              Estimate Std. Error t value Pr(>|t|)    
# (Intercept) 29.599855   1.229720  24.070  < 2e-16 ***
# disp        -0.041215   0.004712  -8.747 9.38e-10 ***
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

# Residual standard error: 3.251 on 30 degrees of freedom
# Multiple R-squared:  0.7183,  Adjusted R-squared:  0.709 
# F-statistic: 76.51 on 1 and 30 DF,  p-value: 9.38e-10

savez-vous où à l'aide de poly auraient leur place dans le summary(lm(formula = x...) composant?

OriginalL'auteur Victorp

10

Cela va le faire pour vous.
```
lapply( mtcars[,-1], function(x) summary(lm(mtcars$mpg ~ x)) )
```
De données.image de l'objet est une liste de certains autres caractéristiques, ce qui permettra de passer à travers chaque colonne de mtcars à l'exclusion de la première, et effectuer les régressions. Si vous enregistrez la liste dans quelque chose comme L ensuite, vous pouvez accéder à chacun facilement juste en utilisant le même nom ou numéro de la colonne dans les données d'origine.cadre. Donc L$cyl donne la régression résumé pour mpg sur cyl.

En fait celui-ci fait plus de sens. Et peut aussi facilement faire des trucs comme lapply(L, function(x) x$r.squared) ; lapply(L, coef)

OriginalL'auteur John
5

De données.version de table de Johns solution
```
library(data.table)
Fits <- 
    data.table(mtcars)[, 
              .(MyFits = lapply(.SD, function(x) summary(lm(mpg ~ x)))), 
              .SDcols = -1]
```
Quelques explications sur le code
- data.table va convertir mtcars à un data.table objet
- .SD est aussi un data.table objet qui contient les colonnes on veut opérer sur
- .SDcols = -1 dit .SD de ne pas utiliser la première colonne (comme nous ne voulons pas d'ajustement lm(mpg ~ mpg)
- lapply juste exécute le modèle sur toutes les colonnes dans .SD (à l'exception de celui que nous avons sauté) et renvoie les objets de la classe list
Fit sera une liste de résumés, vous pouvez les contrôler à l'aide de
```
Fits$MyFits
```
Mais vous pouvez aussi travailler sur eux, par exemple, l'application de coef fonction sur chaque ajustement
```
Fits[, lapply(MyFits, coef)]
```
Ou de l'obtention de la r.squered
```
Fits[, lapply(MyFits, `[[`, "r.squared")]
```
Merci pour cette! Lorsque j'utilise cette solution, j'obtiens l'erreur suivante: Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) : 0 (non-NA) cases Toutes les idées ce qui conduit à cette erreur? Je veux l'utiliser sur un plutôt "sale" dataset. Se pourrait-il que certaines exceptions sont nécessaires? Est-il par exemple possible d'ajouter un try déclaration de cette solution pour l'empêcher d'exploser?
Cela signifie probablement que l'ensemble de vos valeurs sont NAs probablement. Vous avez besoin de nettoyer vos données ou de les utiliser tryCatch. De toute façon, cette réponse est vieux et a besoin d'une mise à jour.
Je vous remercie pour votre réponse. Je pensais que, au premier abord, mais j'ai enlevé toutes les variables où toutes les valeurs (plus de 99%) ont été NA. Pour mon (énorme) dataset peut-être qu'il est plus probable qu'il existe des non-variables numériques? Mais je suppose alors tryCatch serait encore la solution. Je n'ai pas utilisé data.table beaucoup encore. Serait-il possible de me montrer où à intégrer les tryCatch?
Vous pouvez simplement vérifier que la variable est numérique d'abord, par exemple, data.table(mtcars)[, .(MyFits = lapply(.SD, function(x) if(is.numeric(x)) summary(lm(mpg ~ x)))), .SDcols = -1]
Merci, j'ai encore du mal à voir comment je appliquer ce genre de déclaration. Lorsque j'ai appliqué votre solution de mtcars par la façon dont je reçois alors les lignes qui commence comme list(call = lm(formula = mpg ~ x), terms = mpg ~ x, residu.. Était-ce le résultat voulu ou est-ce que quelque chose va mal il?

OriginalL'auteur David Arenburg

Vous devez vous connecter pour publier un commentaire.