R Langue: Comment puis-je imprimer / voir le résumé statistiques pour exemple de sous-ensemble?
Ce sont certaines des questions de newbie sur les statistiques de programmation pour la R pour lequel je n'ai pas été en mesure de trouver une réponse en ligne. Mon dataframe est intitulé "l'eitc" dans le code ci-dessous.
1) une Fois que j'ai chargé dans un bloc de données, je tiens à regarder les statistiques de résumé. J'ai utilisé les fonctions:
eitc <- read.dta(file="/Users/Documents/eitc.dta")
summary(eitc)
sapply(eitc,mean,na.rm=TRUE) #for sample mean, min, max, etc.
Comment puis-je trouver des statistiques sommaires sur mon dataframe lorsque certains critères sont respectés. Par exemple, je voudrais voir le résumé des statistiques sur l'ensemble des variables lorsque la variable "enfants" est supérieur ou égal à 1. L'équivalent Stata code est:
summarize if children >= 1
2) de Même, comment puis-je trouver les paramètres spécifiques lorsque certains critères sont respectés? Par exemple, je veux trouver la moyenne de la variable "travail" lorsque "post93" la variable est égale à zéro et "anykids" la variable est égale à 1. L'équivalent Stata code est:
mean work if post93==0 & anykids==1
3) Idéalement, lorsque je lance le résumé statistiques ci-dessus, je voudrais savoir comment de nombreuses observations ont été inclus dans le calcul de l'critères.
4) Quand j'ai lu dans mon bloc de données, il serait également agréable de voir comment de nombreuses observations sont inclus dans le jeu de données (et peut-être combien de lignes ont des valeurs manquantes ou "NA").
5) Aussi, j'ai été la création de variables muettes en utilisant le code suivant. Est-ce la bonne façon de le faire ou est-il plus efficace?
post93.dummy <- as.numeric(eitc$year>1993)
eitc=cbind(eitc,post93.dummy)
OriginalL'auteur baha-kev | 2011-01-29
Vous devez vous connecter pour publier un commentaire.
Beaucoup de vos exigences sont répondues par
subset
, par exempleLa
?subset
documentation a de bons exemples.La
cbind
méthode de fixation des variables muettes est inutile. Il suffit de ne:OriginalL'auteur Michael Dunn
Je vais utiliser
mtcars
données disponibles dansdatasets
paquet. Voir?mtcars
.Ad 1. Vous pouvez voir le résumé de
mtcars
quandgear
est supérieur à 3:Ad 2. Utilisation
with
:Ad 3. Ibid (mais l'utilisation
length
):Ad 4. Voir le précédent, mais de là à trouver
faire quelque chose comme ceci:
Ad 5. Ce n'est pas une variable muette, c'est une sorte de sous-ensemble de données d'origine, columnwise concaténées. Ce que vous essayez d'atteindre de toute façon?
Soyez concis. Une question par question, s'il vous plaît!
OriginalL'auteur aL3xa
Je recommanderais vous regardez le plyr paquet pour générer des résumés. Voici quelques rapide de code (pas);
Vous pouvez également regarder la hmisc et psy paquets pour plus descriptif stat routines. (Découvrez Rapide-R pour plus d'info)
OriginalL'auteur PaulHurleyuk
Voici comment vous pouvez rapidement afficher des statistiques sommaires pour un sous-ensemble de vos données à l'aide de les données.table.
Vous pouvez utiliser
model.matrix
pour la création des variables nominales, voir ici.OriginalL'auteur pbaylis