Complète.obs de cor() la fonction
Je suis en train de créer une matrice de corrélation pour mes données, qui ressemble à ceci
df <- structure(list(V1 = c(56, 123, 546, 26, 62, 6, NA, NA, NA, 15
), V2 = c(21, 231, 5, 5, 32, NA, 1, 231, 5, 200), V3 = c(NA,
NA, 24, 51, 53, 231, NA, 153, 6, 700), V4 = c(2, 10, NA, 20,
56, 1, 1, 53, 40, 5000)), .Names = c("V1", "V2", "V3", "V4"), row.names = c(NA,
10L), class = "data.frame")
Cela donne les données suivantes cadre:
V1 V2 V3 V4
1 56 21 NA 2
2 123 231 NA 10
3 546 5 24 NA
4 26 5 51 20
5 62 32 53 56
6 6 NA 231 1
7 NA 1 NA 1
8 NA 231 153 53
9 NA 5 6 40
10 15 200 700 5000
J'utilise normalement un complet.obs commande pour établir mon matrice de corrélation à l'aide de cette commande
crm <- cor(df, use="complete.obs", method="pearson")
Ma question est de savoir comment le remplir.obs traiter les données? n'omettez une ligne ayant un "NA", faire un "NA" table libre et de faire une matrice de corrélation à la fois comme ceci?
df2 <- structure(list(V1 = c(26, 62, 15), V2 = c(5, 32, 200), V3 = c(51,
53, 700), V4 = c(20, 56, 5000)), .Names = c("V1", "V2", "V3",
"V4"), row.names = c(NA, 3L), class = "data.frame")
ou faut-il omettre "NA" valeurs par paires de la mode, par exemple lors du calcul de corrélation entre la V1 et la V2, la ligne qui contient un NA de valeur dans la V3, (tels que les lignes 1 et 2 dans mon exemple) sont-ils omis trop?
Si c'est le cas, je suis impatient d'établir une commande qui se réserve, autant que possible, des données, en omettant NA les valeurs par paires de la mode.
Merci beaucoup,
OriginalL'auteur Error404 | 2013-09-19
Vous devez vous connecter pour publier un commentaire.
Regarder le fichier d'aide pour
cor
, c'est à dire?cor
. En particulier,Pour obtenir une meilleure idée de ce qui se passe, est de créer une (même) exemple plus simple:
Donc, lorsque nous utilisons
complete.obs
, nous jeter le ensemble ligne si uneNA
est présent. Dans mon exemple, cela signifie que nous supprimer des lignes 1 et 2. Cependant,pairwise.complete.obs
utilise le non-NA
valeurs lors du calcul de la corrélation entreV1
etV2
.Ma mise à jour de la réponse de l'aide
Aaaalright, exactement ce que je recherche. Apprécié 🙂
OriginalL'auteur csgillespie