La détermination de la bonté d'un R ajustement à l'aide de lm()
J'ai appris à obtenir un ajustement linéaire avec certains points à l'aide de lm dans mon script R. Donc, je l'ai fait (qui a travaillé nice), et imprimé la forme:
lm(formula = y2 ~ x2)
Residuals:
1 2 3 4
5.000e+00 -1.000e+01 5.000e+00 7.327e-15
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 70.000 17.958 3.898 0.05996 .
x2 85.000 3.873 21.947 0.00207 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 8.66 on 2 degrees of freedom
Multiple R-squared: 0.9959, Adjusted R-squared: 0.9938
F-statistic: 481.7 on 1 and 2 DF, p-value: 0.00207
Je suis en train de déterminer la meilleure façon de juger de l'ampleur de cet ajustement est. J'ai besoin de comparer cet ajustement, avec quelques autres (qui sont aussi linéaires à l'aide de lm()
fonction). Quelle est la valeur de ce résumé serait le meilleur moyen de juger de la façon dont bon cet ajustement est? Je pensais utiliser le residual standard error. Toutes les suggestions. Aussi, comment puis-je extraire de la valeur de la variable d'ajustement?
- This question sur les stats.SE est essentiellement une dup, bien que l'on a accepté de répondre essentiellement dit d'aller lire une statistique livre.
- mais comment puis-je obtenir les valeurs de la variable d'ajustement?
- Gee, je me demande si il y a un problème avec la corrélation ici...
Vous devez vous connecter pour publier un commentaire.
Si vous voulez accéder aux pièces produites par
summary
directement, vous pouvez les appelersummary
et stocker le résultat dans une variable et ensuite inspecter l'objet résultant:Peut-être
rs$sigma
est ce que vous recherchez?MODIFIER
Avant que quelqu'un me reproche, je dois souligner que certaines de ces informations, ce n'est pas la méthode recommandée pour y accéder. Vous devez plutôt utiliser désignés extracteurs comme
residuals()
oucoef
.coef
,fitted
etresiduals
, je crois. Ne pas me citer sur que le fait d'être une liste complète, cependant.Ce code, vous pourriez faire quelque chose de similaire:
Le réglage de la R^2 est la "qualité de l'ajustement" de la mesure. C'est dire que 99% de la variance dans y2 peuvent être "expliquée" par une ligne droite d'ajustement de y2 à x2. Si vous voulez interpréter votre modèle avec seulement 4 points de données sur la base de ce résultat est une question de jugement. Il semble un peu dangereux pour moi.
Pour extraire la somme résiduelle des carrés que vous utilisez:
Voir ce pour plus de détails:
Il y a quelques belles régression graphiques de diagnostic que vous pouvez regarder avec
de l'endroit où=1:6 vous donner tous les six parcelles. Le RESET test et bptest sera un test pour la mauvaise spécification et de l'hétéroscédasticité:
Il ya beaucoup de ressources là-bas pour penser à ce genre de chose. Côté d'Distributions dans la R est l'un d'entre eux, et loin de la "Pratique de Régression et analyse de Variance" est un R classique. En gros, j'ai appris l'économétrie dans la R de Farnsworth du papier/livre, bien que je ne me souviens pas si il a quelque chose à propos de la qualité de l'ajustement.
Si vous allez faire beaucoup de l'économétrie dans R, L'Économétrie appliquée à la R est un grand salaire-pour le livre. Et j'ai utilisé le R pour les Économistes page web beaucoup.
Ceux-ci sont les premières qui apparaissent à l'esprit. Je vais réfléchir un peu plus.