moyens et SD pour les colonnes dans un dataframe avec NA des valeurs
Je suis en train de calculer la moyenne et l'écart de plusieurs colonnes (à l'exception de la première colonne) dans un ensemble de données.cadre avec NA
valeurs.
J'ai essayé colMeans
, sapply
, etc., pour créer une boucle qui s'exécute à travers les données.cadre et stocke ensuite les moyens et les écarts-types dans un tableau distinct, mais reçois un "PLAISIR" d'erreur. toute aide serait super. Grâce
un
Pouvez-vous poster le code pour ce que vous avez essayé? Il n'est pas clair où vous êtes coincé.
Un "plaisir" erreur n'est pas une bonne façon de le mettre. ce qui pourrait aider est le texte exact de l'erreur msg - ne présumez pas que personne ne serait-il comprendre de toute façon.
Un "plaisir" erreur n'est pas une bonne façon de le mettre. ce qui pourrait aider est le texte exact de l'erreur msg - ne présumez pas que personne ne serait-il comprendre de toute façon.
OriginalL'auteur Anand Roopsind | 2013-12-27
Vous devez vous connecter pour publier un commentaire.
...
pour améliorer la clarté:sapply(df, function(...) list(means=mean(..., na.rm=TRUE), sds=sd(..., na.rm=TRUE)))
Vous pensez que c'est "plus clair"? La mienne ressemble plus concrète, et je pense que générerait plus instructif messages d'erreur, et j'ai pensé "plus clair", mais peut-être que je suis absent quelque chose de plus profond ou même quelque chose de plus évident?
Oui, l'utilisation des points de suspension pour les principaux arg(s) dont nous ne sommes pas la modification est plus clair et c'est une convention dans R. Comme vous pouvez le voir à partir de l'écrémage, il appelle très clairement que le point de notre code est à ajouter à la non-par défaut arg
na.rm=TRUE
à deux fn appels. Et avec plus de force, les points de suspension peuvent se présenter à plusieurs arguments. Et le message d'erreur de la vôtre ne vont pas être plus clair.Je suis un peu familiarisé avec le R-points (points de suspension) analyse de formalisme, mais j'ai raté ce document de consensus. Je voudrais lire des documents s'ils sont liés.
Il n'y a pas d'autorité de citation, j'en suis conscient, mais c'est assez répandue dans le code; Hadley l'utilise beaucoup dans ses paquets. Voici citation
OriginalL'auteur 42-
Les fonctions que vous devriez être en utilisant (par exemple
colMeans
) sera de presque tous ont un paramètre appeléna.rm
qui, par défaut,FALSE
. Il suffit de necolMeans(x = your_df, na.rm = TRUE)
et vous serez bon d'aller. Même avec l'aide de seulementmean()
si vous voulez aller à la colonne par colonne.OriginalL'auteur Adam Hyland
L'exemple de code suivant peut s'avérer utile.
Pour l'écart-type, remplacer
mean()
avecsd()
.OriginalL'auteur Graeme Walsh