Trouver des éléments communs dans les listes

Je suis en train d'écrire un morceau de code qui peut automatiquement le facteur de l'expression. Par exemple,
si j'ai deux listes [1,2,3,4] et [2,3,5], le code doit être en mesure de trouver les éléments communs dans les deux listes, [2,3], et de combiner le reste des éléments dans une nouvelle liste, [1,4,5].

De ce post: Comment trouver la liste intersection?
Je vois que les éléments communs peuvent être trouvés par

set([1,2,3,4]&set([2,3,5]).

Est-il un moyen facile de récupérer des non-commune éléments de chaque liste, dans mon exemple, [1,4] et [5]?

Je peux aller de l'avant et faire une boucle for:

lists = [[1,2,3,4],[2,3,5]]
conCommon = []
common = [2,3]
for elem in lists:
    for elem in eachList:
    if elem not in common:
        nonCommon += elem

Mais ce qui semble redondant et inefficace. Python fournit aucune fonction pratique qui peut le faire? Merci à l'avance!!!!

vous souhaitez obtenir des listes distinctes comme [1,4] et [5], ou un seul [1,4,5]?

InformationsquelleAutor turtlesoup | 2012-07-05

47

Utiliser le symétrique opérateur de différence pour sets (aka l'opérateur XOR):
```
>>> set([1,2,3]) ^ set([3,4,5])
set([1, 2, 4, 5])
```
- oh wow merci!! Bue le code ci-dessus, prenez la même quantité de temps de calcul et l'espace mémoire en tant que set([1,2,3])&set([3,4,5])? Ou il n'a pas une influence significative sur les performances du code?
- C'est le moyen le plus efficace pour atteindre votre objectif. Sa complexité est du même ordre que & (à savoir, linéaire en le nombre d'éléments dans les jeux).
InformationsquelleAutor Amber
12

Vous pouvez utiliser Intersection concept pour faire face à ce genre de problèmes.
```
b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
set(b1).intersection(b2)
Out[22]: {4, 5}
```
Meilleure chose à propos de l'utilisation de ce code est qu'il fonctionne assez rapide pour les données de grande taille également. J'ai b1 avec 607139 et b2 avec 296029 éléments lorsque j'utilise cette logique-je obtenir mes résultats en 2,9 secondes.

InformationsquelleAutor saimadhu.polamuri
1

Vieille question, mais il semble que python a une fonction intégrée pour fournir exactement ce que vous cherchez: .difference().

EXEMPLE
```
list_one = [1,2,3,4]
list_two = [2,3,5]

one_not_two = set(list_one).difference(list_two)
# set([1, 4])

two_not_one = set(list_two).difference(list_one)
# set([5])
```
Cela pourrait aussi être écrit comme:
```
one_not_two = set(list_one) - set(list_two)
```
Calendrier

J'ai couru certains timing des tests sur les deux, et il semble que .difference() a un léger avantage, à hauteur de 10% à 15%, mais chaque méthode a fallu environ un huitième de seconde pour filtre 1M éléments (entiers aléatoires entre 500 et 100 000), de sorte que si vous êtes très temps sensible, c'est probablement négligeable.

Autres Notes

Il semble que l'OP est à la recherche d'une solution qui fournit deux listes distinctes (ou ensembles) - celui où la première contient des éléments non dans la seconde, et vice versa. La plupart des réponses précédentes retourner une seule liste ou un ensemble qui comprennent tous les éléments.

Il y a également la question de savoir si les éléments qui peuvent être reproduits dans la première liste devrait être compté plusieurs fois, ou juste une fois.

Si l'OP veut maintenir les doublons, une compréhension de liste peut être utilisée, par exemple:
```
one_not_two = [ x for x in list_one if x not in list_two ]
two_not_one = [ x for x in list_two if x not in list_one ]
```
...qui est à peu près la même solution, tel qu'il est posé dans la question d'origine, seulement un peu plus propre. Cette méthode permettrait de maintenir les doublons de la liste d'origine mais est considérablement (comme plusieurs ordres de grandeur) plus lent pour les grands ensembles de données.

InformationsquelleAutor elPastor

Vous pouvez utiliser le .__xor__ attribut de méthode.

set([1,2,3,4]).__xor__(set([2,3,5]))

a = set([1,2,3,4])
b = set([2,3,5])
a.__xor__(b)

InformationsquelleAutor SuperNova

Vous devez vous connecter pour publier un commentaire.