Python - Liste des dictionnaires

Disons que j'ai une liste de dictionnaires:

[
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 2, 'name': 'hanna', 'age': 30},
]

et j'ai besoin d'obtenir une liste des dictionnaires (en supprimant les doublons):

[
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 2, 'name': 'hanna', 'age': 30},
]

Quelqu'un peut m'aider avec la façon la plus efficace d'atteindre cet objectif en Python?

Quelle est l'ampleur de ces dictionnaires? Avez-vous besoin d'attribut individuel vérification pour déterminer les doublons, ou est en train de vérifier une seule valeur en eux-ils suffisants?
Ces dicts obtenu 8 clé:valeur des paires et de la liste des 200 dicts. Ils ont effectivement obtenu un ID et il est sûr pour moi de supprimer le dict de la liste si la si la valeur trouvée est un doublon.
Double Possible de Comment faire pour mettre les valeurs dans la liste de dictionnaire unique?
forzenset c'est une option efficace. set(frozenset(i.items()) for i in list)

InformationsquelleAutor Limaaf | 2012-06-18

dictionary python

191

Faire un temporaire dict avec à la clé la id. Cela permet de filtrer les doublons.
Le values() de la dict sera la liste

En Python2.7
```
>>> L=[
... {'id':1,'name':'john', 'age':34},
... {'id':1,'name':'john', 'age':34},
... {'id':2,'name':'hanna', 'age':30},
... ]
>>> {v['id']:v for v in L}.values()
[{'age': 34, 'id': 1, 'name': 'john'}, {'age': 30, 'id': 2, 'name': 'hanna'}]
```
En Python3
```
>>> L=[
... {'id':1,'name':'john', 'age':34},
... {'id':1,'name':'john', 'age':34},
... {'id':2,'name':'hanna', 'age':30},
... ] 
>>> list({v['id']:v for v in L}.values())
[{'age': 34, 'id': 1, 'name': 'john'}, {'age': 30, 'id': 2, 'name': 'hanna'}]
```
En Python2.5/2.6
```
>>> L=[
... {'id':1,'name':'john', 'age':34},
... {'id':1,'name':'john', 'age':34},
... {'id':2,'name':'hanna', 'age':30},
... ] 
>>> dict((v['id'],v) for v in L).values()
[{'age': 34, 'id': 1, 'name': 'john'}, {'age': 30, 'id': 2, 'name': 'hanna'}]
```
- De ce fait la job =) à peu près toutes les réponses sont correctes, et m'a aidé. Ce marquage comme le bon pour l'inclusion des versions de python diff code. Bravo à tout le monde qui m'a aidé.
- La Rooy - comment pourrait-on l'utiliser pour supprimer dictionarys à partir d'une liste basée sur les attributs multiples , essayé cela, mais ne semble pas fonctionner > {v['vol']['longitude']['lat']: v pour v dans les cours d'}.les valeurs de()
- en supposant que chacun pouvant être exprimées à la str (ou unicode), essayez ceci: {str(v['flight'])+':'+str(v['lon'])+','+str(v['lat']): v for v in stream}.values() Cela crée une clé unique en fonction de vos valeurs. Comme 'MH370:-21.474370,86.325589'
- vous pouvez utiliser un tuple, dictionnaire clé {(v['flight'], v['lon'], v['lat']): v for v in stream}.values()
- notez que cela peut modifier l'ordre des dictionnaires dans la liste! utilisation OrderedDict de collections list(OrderedDict((v['id'], v) for v in L).values()) ou de tri de la liste si cela fonctionne mieux pour vous
- Cela a fonctionné pour moi
InformationsquelleAutor John La Rooy
63

La manière habituelle pour trouver les éléments communs d'un ensemble est d'utiliser Python set classe. Ajouter tous les éléments de l'ensemble, puis de convertir l'ensemble à un list, et bam les doublons sont partis.

Le problème, bien sûr, c'est qu'un set() ne peut contenir que des hashable entrées, et un dict n'est pas hashable.

Si j'ai eu ce problème, ma solution serait de convertir chaque dict dans une chaîne de caractères qui représente le dict, puis ajoutez toutes les chaînes à une set() puis la lecture de la chaîne de valeurs comme un list() et de convertir retour à dict.

Une bonne représentation d'un dict dans la forme d'une chaîne est le format JSON. Et Python a intégré dans le module JSON (appelé json bien sûr).

Le problème reste que les éléments dans un dict ne sont pas commandés, et quand Python convertit le dict à une chaîne JSON, vous pourriez obtenir deux chaînes JSON qui représentent l'équivalent des dictionnaires, mais ne sont pas identiques cordes. La solution facile est de passer l'argument sort_keys=True lorsque vous appelez json.dumps().

EDIT: Cette solution est à supposer qu'un dict peut avoir un rôle différent. Si nous pouvons supposer que chaque dict avec la même "id" de la valeur de correspondre à tous les autres dict avec la même "id" valeur, alors c'est exagéré; @gnibbler la solution serait plus rapide et plus facile.

EDIT: Maintenant, il y a un commentaire d'André Lima qui dit explicitement que si l'ID est un doublon, il est sûr de supposer que l'ensemble de la dict est un doublon. Si cette réponse est exagéré, et je recommande @gnibbler de réponse.
- Merci pour l'aide steveha. Votre réponse m'a donné une certaine connaissance je n'ai pas eu, car je viens de commencer avec Python =)
- Tout exagéré compte tenu de l'ID dans ce cas particulier, c'est toujours une excellente réponse!
- Cela m'aide depuis mon dictionnaire ne pas avoir une clé, et n'est identifié de manière unique par l'ensemble de ses entrées. Merci!
InformationsquelleAutor steveha
17

Vous pouvez utiliser numpy bibliothèque (pour Python2.x uniquement):
```
   import numpy as np 

   list_of_unique_dicts=list(np.unique(np.array(list_of_dicts)))
```
Pour l'obtenir, il a travaillé avec Python 3.x (et les versions récentes de numpy), vous devez convertir le tableau des dicts de numpy tableau de chaînes de caractères, par exemple
```
list_of_unique_dicts=list(np.unique(np.array(list_of_dicts).astype(str)))
```
- Obtenez le message d'erreur TypeError: unorderable types: dict() > dict() lors de cette opération Python 3.5.
InformationsquelleAutor bubble
14

Dans le cas où les dictionnaires ne sont identifiés de manière unique par tous les éléments (ID n'est pas disponible), vous pouvez utiliser la réponse à l'aide de JSON. Ce qui suit est une alternative à ne pas utiliser JSON, et de travailler aussi longtemps que toutes les dictionnaire les valeurs sont immuables
```
[dict(s) for s in set(frozenset(d.items()) for d in L)]
```
InformationsquelleAutor Sina

Voici raisonnablement une solution compacte, bien que je soupçonne pas particulièrement efficace (c'est un euphémisme):

>>> ds = [{'id':1,'name':'john', 'age':34},
...       {'id':1,'name':'john', 'age':34},
...       {'id':2,'name':'hanna', 'age':30}
...       ]
>>> map(dict, set(tuple(sorted(d.items())) for d in ds))
[{'age': 30, 'id': 2, 'name': 'hanna'}, {'age': 34, 'id': 1, 'name': 'john'}]

Entourent le map() appel avec list() en Python 3 pour obtenir une liste de revenir, sinon, c'est un map objet.

InformationsquelleAutor Greg E.

7

Depuis le id est suffisante pour détecter les doublons et les id est hashable: run 'em par le biais d'un dictionnaire qui a le id comme la clé. La valeur de chaque clé est le dictionnaire d'origine.
```
deduped_dicts = dict((item["id"], item) for item in list_of_dicts).values()
```
En Python 3, values() ne retourne pas une liste; vous en aurez besoin pour envelopper l'ensemble de la droite de cette expression dans les list(), et vous pouvez écrire la viande de l'expression de la plus économiquement comme dict compréhension:
```
deduped_dicts = list({item["id"]: item for item in list_of_dicts}.values())
```
À noter que le résultat ne sera probablement pas dans le même ordre que l'original. Si c'est une exigence, vous pouvez utiliser un Collections.OrderedDict au lieu d'un dict.

En aparté, il peut faire une bonne affaire de sens à garder les données dans un dictionnaire qui utilise le id comme la clé pour commencer.

InformationsquelleAutor kindall
6
```
a = [
{'id':1,'name':'john', 'age':34},
{'id':1,'name':'john', 'age':34},
{'id':2,'name':'hanna', 'age':30},
]

b = {x['id']:x for x in a}.values()

print(b)
```
sorties:

[{"âge": 34, 'id': 1, 'nom': 'john'}, {'age': 30, 'id': 2, 'nom': 'hanna'}]
- Dans le même exemple. comment puis-je obtenir les dicts contenant uniquement de la même Id ?
- que voudriez-vous la sortie de l'air?
- Parfois, je vais avoir le même ID mais d'âge différent. donc la sortie de la [{"âge": [34, 40], "id": 1, "name": ["john", Pierre]}]. En bref, si les Identifiants sont les mêmes, puis de combiner les contenus des autres à une liste comme je l'ai mentionné ici. Merci à l'avance.
- b = {x['id']:[y de y dans un si y['id'] == x['id'] ] pour x dans un} est une façon de les regrouper.
InformationsquelleAutor Yusuf X

Expansion sur John La Rooy (Python - Liste des dictionnaires) réponse, le rendant un peu plus souple:

def dedup_dict_list(list_of_dicts: list, columns: list) -> list:
    return list({''.join(row[column] for column in columns): row
                for row in list_of_dicts}.values())

L'Appel De La Fonction:

sorted_list_of_dicts = dedup_dict_list(
    unsorted_list_of_dicts, ['id', 'name'])

InformationsquelleAutor Illegal Operator

Un quick-and-dirty solution est simplement de générer une nouvelle liste.

sortedlist = []

for item in listwhichneedssorting:
    if item not in sortedlist:
        sortedlist.append(item)

InformationsquelleAutor lyzazel

1

En python 3.6+ (ce que j'ai testé), il suffit d'utiliser:
```
import json

#Toy example, but will also work for your case 
myListOfDicts = [{'a':1,'b':2},{'a':1,'b':2},{'a':1,'b':3}]
#Start by sorting each dictionary by keys
myListOfDictsSorted = [sorted(d.items()) for d in myListOfDicts]

#Using json methods with set() to get unique dict
myListOfUniqueDicts = list(map(json.loads,set(map(json.dumps, myListOfDictsSorted))))

print(myListOfUniqueDicts)
```
Explication: nous sommes cartographie de la json.dumps pour coder les dictionnaires comme des objets json, qui sont immuables. set peut ensuite être utilisé pour produire un objet iterable unique immutables. Enfin, nous convertir en arrière de notre dictionnaire de la représentation à l'aide de json.loads. Notez qu'au départ, on doit trier par touches pour organiser les dictionnaires dans une forme unique. Ceci est valable pour Python 3.6+ depuis les dictionnaires sont commandés par défaut.
- N'oubliez pas de trier les clés avant de dumping en JSON. Vous aussi n'avez pas besoin de les convertir à list avant de faire set.
- Ha bon observations, je vais mettre à jour ma réponse.
InformationsquelleAutor VanillaSpinIce

L'on peut faire avec pandas

import pandas as pd
yourdict=pd.DataFrame(L).drop_duplicates().to_dict('r')
Out[293]: [{'age': 34, 'id': 1, 'name': 'john'}, {'age': 30, 'id': 2, 'name': 'hanna'}]

Avis légèrement différent de l'accepter réponse.

drop_duplicates va vérifier toutes les colonnes dans les pandas , si tous les mêmes alors la ligne sera supprimée .

Par exemple :

Si l'on change le 2ème dict nom de jean à peter

L=[
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 1, 'name': 'peter', 'age': 34},
    {'id': 2, 'name': 'hanna', 'age': 30},
]
pd.DataFrame(L).drop_duplicates().to_dict('r')
Out[295]: 
[{'age': 34, 'id': 1, 'name': 'john'},
 {'age': 34, 'id': 1, 'name': 'peter'},# here will still keeping the dict in the out put 
 {'age': 30, 'id': 2, 'name': 'hanna'}]

InformationsquelleAutor WeNYoBen

Assez simple option:

L = [
    {'id':1,'name':'john', 'age':34},
    {'id':1,'name':'john', 'age':34},
    {'id':2,'name':'hanna', 'age':30},
    ]


D = dict()
for l in L: D[l['id']] = l
output = list(D.values())
print output

InformationsquelleAutor jedwards

Je ne sais pas si vous voulez seulement l'id de votre dicts dans la liste pour être unique, mais si l'objectif est de disposer d'un ensemble de dict où l'unicité est sur toutes les touches' valeurs.. vous devriez utiliser les tuples de la clé dans votre compréhension :

>>> L=[
...     {'id':1,'name':'john', 'age':34},
...    {'id':1,'name':'john', 'age':34}, 
...    {'id':2,'name':'hanna', 'age':30},
...    {'id':2,'name':'hanna', 'age':50}
...    ]
>>> len(L)
4
>>> L=list({(v['id'], v['age'], v['name']):v for v in L}.values())
>>>L
[{'id': 1, 'name': 'john', 'age': 34}, {'id': 2, 'name': 'hanna', 'age': 30}, {'id': 2, 'name': 'hanna', 'age': 50}]
>>>len(L)
3

Espère que cela vous aide à vous ou une autre personne ayant le souci....

InformationsquelleAutor nixmind

Il y a beaucoup de réponses ici, alors laissez-moi ajouter une autre:

import json
from typing import List

def dedup_dicts(items: List[dict]):
    dedupped = [ json.loads(i) for i in set(json.dumps(item, sort_keys=True) for item in items)]
    return dedupped

items = [
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 1, 'name': 'john', 'age': 34},
    {'id': 2, 'name': 'hanna', 'age': 30},
]
dedup_dicts(items)

InformationsquelleAutor monkut

-1

Heres une mise en œuvre avec peu de surcharge de la mémoire au détriment de ne pas être aussi compact que le reste.
```
values = [ {'id':2,'name':'hanna', 'age':30},
           {'id':1,'name':'john', 'age':34},
           {'id':1,'name':'john', 'age':34},
           {'id':2,'name':'hanna', 'age':30},
           {'id':1,'name':'john', 'age':34},]
count = {}
index = 0
while index < len(values):
    if values[index]['id'] in count:
        del values[index]
    else:
        count[values[index]['id']] = 1
        index += 1
```
de sortie:
```
[{'age': 30, 'id': 2, 'name': 'hanna'}, {'age': 34, 'id': 1, 'name': 'john'}]
```
- Vous avez besoin de tester un peu plus. La modification de la liste alors que vous êtes à parcourir, il peut ne pas toujours fonctionner comme prévu
- très bon point! Je vais supprimer la réponse et de le tester de manière plus approfondie.
- est-ce mieux?
- Regarde mieux. Vous pouvez utiliser un ensemble de garder une trace de l'ids à la place de la dict. Envisager de commencer le index à len(values) et compter à rebours, ce qui signifie que vous pouvez toujours décrémenter index si vous del ou pas. par exemple for index in reversed(range(len(values))):
- intéressant, des séries quasi constante de regarder comme des dictionnaires?
- oui, la recherche fonctionne de la même
InformationsquelleAutor Samy Vilar
-3

C'est la solution que j'ai trouvé:
```
usedID = []

x = [
{'id':1,'name':'john', 'age':34},
{'id':1,'name':'john', 'age':34},
{'id':2,'name':'hanna', 'age':30},
]

for each in x:
    if each['id'] in usedID:
        x.remove(each)
    else:
        usedID.append(each['id'])

print x
```
Fondamentalement, vous vérifiez si l'ID est présent dans la liste, si c'est le cas, supprimez le dictionnaire, si non, ajouter l'ID de la liste
- J'aimerais utiliser un ensemble plutôt que de dresser la liste de usedID. Il est plus rapide de recherche, et plus lisible
- Oui je na sais sur les jeux... mais je suis en train d'apprendre... je viens de regarder à @gnibbler de réponse...
- Vous avez besoin de tester un peu plus. La modification de la liste alors que vous êtes à parcourir, il peut ne pas toujours fonctionner comme prévu
- Oui je ne comprends pas pourquoi ça ne fonctionne pas... les idées de ce que je fais mal?
- Essayez d'exécuter votre code avec 3 copies des pièces d'identité 1 dans une rangée.
- Non j'ai pris le problème... c'est juste que je ne comprends pas pourquoi son donnant à ce problème... le savez-vous?
- Lorsque vous supprimez un élément de la liste, tous les autres éléments sont déplacés vers le bas en un seul endroit, donc each jamais les références de l'article suivant est retiré
InformationsquelleAutor tabchas

Vous devez vous connecter pour publier un commentaire.