Se débarrasser de lignes avec les mêmes attributs dans la R

J'ai un gros dataframe avec des colonnes telles que:

ID, time, OS, IP

Chaque ligne de cette dataframe correspond à une entrée. Dans ce dataframe pour certains Id plusieurs entrées (lignes) existent. Je tiens à vous débarrasser de ces multiples lignes (évidemment, les autres attributs différents pour le même ID). Ou placer différents: je veux seulement d'une seule entrée (ligne) pour chaque ID.

Lorsque j'utilise unique sur la colonne ID, je ne recevrez que les niveaux (ou chaque IDENTIFIANT unique), mais je veux garder les autres attributs.
J'ai essayé d'utiliser apply(x,2,unique(data$ID)), mais cela ne fonctionne pas non plus.

Vous devez définir ce que vous voulez faire avec les autres attributs pour les observations avec le même ID lorsque le n'est pas d'accord.
eh bien, je voudrais voir les OS de la distribution des utilisateurs... Donc quand j'ai le dataframe avec une seule entrée par l'utilisateur, l'Id de faire: mytable < table(dataset$os.nom) et faire un peu de traçage par la suite...

OriginalL'auteur CatholicEvangelist | 2010-05-03

27
```
subset(data,!duplicated(data$ID))
```
Devrait faire l'affaire

merci infiniment - j'étais sur le point de désespérer...
Cela fonctionnera si vous n'avez pas tout heuristique dans l'esprit pour savoir comment sélectionner les autres données. Semble être une très étrange cas pour moi...
Exactement ce que j'ai juste besoin de Jacques, je vous remercie.

OriginalL'auteur James

Si vous voulez garder une ligne pour chaque ID, mais il y a différentes données sur chaque ligne, alors vous devez décider sur une certaine logique à jeter les lignes supplémentaires. Par exemple:

df <- data.frame(ID=c(1, 2, 2, 3), time=1:4, OS="Linux")
df
  ID time    OS
1  1    1 Linux
2  2    2 Linux
3  2    3 Linux
4  3    4 Linux

Maintenant, je vais garder le maximum de valeur de temps et le dernier OS de la valeur:

library(plyr)
unique(ddply(df, .(ID), function(x) data.frame(ID=x[,"ID"], time=max(x$time), OS=tail(x$OS,1))))
  ID time    OS
1  1    1 Linux
2  2    3 Linux
4  3    4 Linux

merci beaucoup pour la réponse détaillée!!!

OriginalL'auteur Shane

Vous devez vous connecter pour publier un commentaire.