Se débarrasser de lignes avec les mêmes attributs dans la R
J'ai un gros dataframe avec des colonnes telles que:
ID, time, OS, IP
Chaque ligne de cette dataframe correspond à une entrée. Dans ce dataframe pour certains Id plusieurs entrées (lignes) existent. Je tiens à vous débarrasser de ces multiples lignes (évidemment, les autres attributs différents pour le même ID). Ou placer différents: je veux seulement d'une seule entrée (ligne) pour chaque ID.
Lorsque j'utilise unique
sur la colonne ID, je ne recevrez que les niveaux (ou chaque IDENTIFIANT unique), mais je veux garder les autres attributs.
J'ai essayé d'utiliser apply(x,2,unique(data$ID))
, mais cela ne fonctionne pas non plus.
Vous devez définir ce que vous voulez faire avec les autres attributs pour les observations avec le même ID lorsque le n'est pas d'accord.
eh bien, je voudrais voir les OS de la distribution des utilisateurs... Donc quand j'ai le dataframe avec une seule entrée par l'utilisateur, l'Id de faire: mytable < table(dataset$os.nom) et faire un peu de traçage par la suite...
eh bien, je voudrais voir les OS de la distribution des utilisateurs... Donc quand j'ai le dataframe avec une seule entrée par l'utilisateur, l'Id de faire: mytable < table(dataset$os.nom) et faire un peu de traçage par la suite...
OriginalL'auteur CatholicEvangelist | 2010-05-03
Vous devez vous connecter pour publier un commentaire.
Devrait faire l'affaire
Cela fonctionnera si vous n'avez pas tout heuristique dans l'esprit pour savoir comment sélectionner les autres données. Semble être une très étrange cas pour moi...
Exactement ce que j'ai juste besoin de Jacques, je vous remercie.
OriginalL'auteur James
Si vous voulez garder une ligne pour chaque ID, mais il y a différentes données sur chaque ligne, alors vous devez décider sur une certaine logique à jeter les lignes supplémentaires. Par exemple:
Maintenant, je vais garder le maximum de valeur de temps et le dernier OS de la valeur:
OriginalL'auteur Shane