Savoir si la colonne dans la R tableau comprend des valeurs en double?
J'ai une belle dataframe, mon tout premier, et je commence à avoir le coup de R. Une chose que je n'ai pas pu trouver est un test pour les valeurs en double. J'ai une colonne qui j'en suis sûr, est de toutes les valeurs uniques, mais je ne sais pas qui.
Est-il une manière que je peux demander? Pour simplifier, disons que c'est mes données:
var1 var2 var3
1 1 A 1
2 2 B 3
3 3 C NA
4 4 D NA
5 5 E 4
et je veux savoir si var1
jamais se répète.
OriginalL'auteur Amanda | 2012-11-27
Vous devez vous connecter pour publier un commentaire.
Découvrez la
duplicated
fonction:Documentation est ici.
Vous devriez aussi regarder à la
unique
fonction.anyDuplicated
qui pourrait être plus directement pertinente.il convient de rappeler que
any(duplicated(dat$var1))
donnera un T/F valeur, où queanyDuplicated(dat$var1)
donnera un index/d'une valeur de 0.anyDuplicated il est. Alors maintenant, il s'avère que
anyDuplicated(j)
retourne en 2039, ce qui est exactement ceanyDuplicated(j$should_be_unique)
retourne. C'est de 81 000 dossiers. Je peux produire un objet de la matrice de VRAI/FAUX, mais ne peut pas l'examiner pour voir ce que certains de ceux 2039. Nouvelle question?Je crois que j'ai trouvé la réponse à cette question: stackoverflow.com/questions/6986657/...
Notez que
anyDuplicated
renvoie l'index de la première double, pas un nombre de doublons. Le point entier de l'utiliser à la place de tout(dupliqué (...)), c'est que c'est plus rapide pour le retour positif dans le sens où il s'arrêtera à la première.OriginalL'auteur Erik Shilts