Trouver des lignes uniques

Comment puis-je trouver les lignes uniques et de supprimer tous les doublons d'un fichier?
Mon fichier d'entrée est

Je voudrais le resultat:

2
3

sort file | uniq ne sera pas faire le travail. Va afficher toutes les valeurs de 1 heure

Le fichier doit être triés d'abord. sort file | uniq -u sera sortie de la console pour vous.

InformationsquelleAutor amprantino | 2012-12-08

70

uniq a l'option dont vous avez besoin:
```
   -u, --unique
          only print unique lines
```
```
$ cat file.txt
1
1
2
3
5
5
7
7
$ uniq -u file.txt
2
3
```
- Assurez-vous de faire le tri si les entrées dans le fichier ou non déjà triées. tri file.txt | uniq
InformationsquelleAutor Lev Levitsky
15

Utiliser comme suit:
```
sort < filea | uniq > fileb
```
- Ce n'est pas correct, je pense que vous vouliez dire: uniq -u filea > fileb
- J'ai la copie de vos données et de les exécuter et elle fonctionne: sort<filea.txt | uniq>fileb.txt. Peut-être vous laissé les extensions. Je suis sur un Mac OS X. vous devez aller de filea.txt à certains autres fileb.txt
- Il n'est pas nécessaire pour la redirection avec sort et quel est le point de la tuyauterie pour uniq lorsque vous pourriez faire sort -u file -o file ce que vous êtes en train de faire est de retirer les valeurs en double je.e votre fileb contient 1,2,3,5,7 l'OP veut l'unique lignes seulement, ce qui est 2,3 et est réalisé par uniq -u file l'extension de Fichier n'a rien pour elle, votre réponse est fausse.
InformationsquelleAutor kasavbere
7

uniq -u a été me rend fou parce qu'il n'a pas de travail.

Donc au lieu de cela, si vous avez python (la plupart des distributions Linux et des serveurs déjà):

En supposant que vous avez le fichier de données dans notUnique.txt
```
#Python
#Assuming file has data on different lines
#Otherwise fix split() accordingly.

uniqueData = []
fileData = open('notUnique.txt').read().split('\n')

for i in fileData:
  if i.strip()!='':
    uniqueData.append(i)

print uniqueData

###Another option (less keystrokes):
set(open('notUnique.txt').read().split('\n'))
```
Noter qu'en raison des lignes vides, le dernier jeu peut contenir " ou seulement l'espace des chaînes de caractères. Vous pouvez le retirer plus tard. Ou tout simplement sortir avec copie à partir de la borne 😉

#

Juste pour info, à Partir de l'uniq Homme page:

"Note:" uniq " ne pas détecter plusieurs lignes, sauf s'ils sont adjacents. Vous pouvez trier les entrées d'abord, ou l'utilisation de tri -u' sans 'uniq'. Aussi, les comparaisons honneur les règles spécifiées par "LC_COLLATE'."

L'une des façons correctes, d'invoquer avec:
#
tri nonUnique.txt | uniq

Exemple de fonctionnement:
```
$ cat x
3
1
2
2
2
3
1
3

$ uniq x
3
1
2
3
1
3

$ uniq -u x
3
1
3
1
3

$ sort x | uniq
1
2
3
```
L'espace peuvent être imprimés, alors soyez prêt!
- C'est overkilling.
- Merci pour le tri de la partie!
InformationsquelleAutor ashmew2
4

uniq -u < file va faire le travail.
- Pas besoin pour la redirection.
- Oui je sais. Il l'a fait de manière habituelle
- Seulement si le fichier est déjà trié
InformationsquelleAutor Shiplu Mokaddim
3

uniq devrait faire l'affaire si vous êtes fichier est/peut être triée, si vous ne pouvez pas trier le fichier pour une raison quelconque, vous pouvez utiliser awk:

awk '{a[$0]++}END{for(i in a)if(a[i]<2)print i}'

InformationsquelleAutor
3

Vous pouvez également imprimer la valeur unique dans "fichier" à l'aide de la cat commande par tuyauterie à sort et uniq

cat file | sort | uniq -u

InformationsquelleAutor skywardcode
2
```
sort -d "file name" | uniq -u
```
cela a fonctionné pour moi pour un semblable. Utilisez cette option si elle n'est pas organisée.
Vous pouvez supprimer le tri si elle est organisée

InformationsquelleAutor a_rookie_seeking_answers
2

Tout sort prend O(n log(n)) de temps, je préfère utiliser
```
awk '!seen[$0]++'
```
awk '!seen[$0]++' est une abréviation pour awk '!seen[$0]++ {print}', la ligne d'impression(=$0) si seen[$0] n'est pas zéro.
- Il plus d'espace, mais seulement O(n) fois.

InformationsquelleAutor Vito Chou
2

vous pouvez utiliser:
```
sort data.txt| uniq -u
```
ce genre de données et filtrer par valeurs uniques

InformationsquelleAutor blacker
0

C'était la première que j'ai essayé
```
skilla:~# uniq -u all.sorted  

76679787
76679787 
76794979
76794979 
76869286
76869286 
......
```
Après avoir fait un chat -e tous.triés
```
skilla:~# cat -e all.sorted 
$
76679787$
76679787 $
76701427$
76701427$
76794979$
76794979 $
76869286$
76869286 $
```
Chaque deuxième ligne dispose d'un espace de fin 🙁
Après la suppression de tous les espaces à droite il a travaillé!

merci

InformationsquelleAutor amprantino

Vous devez vous connecter pour publier un commentaire.

En supposant que vous avez le fichier de données dans notUnique.txt

Noter qu'en raison des lignes vides, le dernier jeu peut contenir " ou seulement l'espace des chaînes de caractères. Vous pouvez le retirer plus tard. Ou tout simplement sortir avec copie à partir de la borne 😉

Exemple de fonctionnement:

L'espace peuvent être imprimés, alors soyez prêt!