Comment puis-je identifier les étiquettes de valeurs aberrantes dans un R une boîte à moustaches?
La R boîte à moustaches de la fonction est un moyen très utile de regarder de données: rapidement il vous donne un résumé visuel de la localisation approximative et la variance de vos données, et le nombre de valeurs aberrantes. En outre, je tiens à identifier les valeurs aberrantes, afin de trouver rapidement des problèmes dans le jeu de données.
Les valeurs de ces valeurs aberrantes peut être consulté à l'aide de myplot$out
. Malheureusement, la étiquettes de ces valeurs aberrantes semblent être indisponible. Il y a quelques paquets visant à afficher les étiquettes sur l'intrigue elle-même: http://www.r-statistics.com/2011/01/how-to-label-all-the-outliers-in-a-boxplot/, mais ils ne fonctionnent pas bien et je veux juste la liste de ces valeurs aberrantes, je n'ai pas besoin d'eux pour être sur l'intrigue elle-même.
Des idées?
OriginalL'auteur static_rtti | 2012-06-21
Vous devez vous connecter pour publier un commentaire.
Vous avez fait le plus dur du travail vous-même. Tout ce qui reste est une comparaison:
Saisir les valeurs aberrantes
Extraire les valeurs aberrantes de l'original de la trame de données
Plus d'explications:
La variable
dd$x
est le vecteur de 26 numéros. La variableoutliers
contient les valeurs de valeurs aberrantes (il suffit de taperdd$x
etoutliers
dans votre R de la console). La commandeen adéquation avec les valeurs de dd x$et des valeurs aberrantes, à savoir:
La notation crochets,
dd[dd$x %in% outliers,]
retourne les lignes de la trame de donnéesdd
, oùdd$x %in% outliers
retourTRUE
.OriginalL'auteur csgillespie
Je suggère
which(x < myplot$stats[1] | x > myplot$stats[5])
où x est vos données.OriginalL'auteur danas.zuokas
Si la saisie des données est un vecteur avec des éléments nommés, boîte à moustaches conserve les noms.
OriginalL'auteur plannapus