La comparaison de deux collections pour l'égalité indépendamment de l'ordre des éléments dans leur

Je voudrais comparer deux collections (en C#), mais je ne suis pas sûr de la meilleure façon de mettre en œuvre efficacement.

J'ai lu l'autre thread sur Énumérable.SequenceEqual, mais ce n'est pas exactement ce que je cherche.

Dans mon cas, deux collections seraient égaux s'ils contiennent les mêmes éléments (peu importe l'ordre).

Exemple:

collection1 = {1, 2, 3, 4};
collection2 = {2, 4, 1, 3};

collection1 == collection2; //true

Ce que je fais habituellement est de parcourir chaque élément d'une collection et de voir si il existe dans le reste de la collection, puis en boucle sur chaque élément de la collection et de voir s'il existe dans la première collection. (Je commence à en comparant les longueurs).

if (collection1.Count != collection2.Count)
    return false; //the collections are not equal

foreach (Item item in collection1)
{
    if (!collection2.Contains(item))
        return false; //the collections are not equal
}

foreach (Item item in collection2)
{
    if (!collection1.Contains(item))
        return false; //the collections are not equal
}

return true; //the collections are equal

Cependant, ce n'est pas tout à fait correct, et ce n'est probablement pas le moyen le plus efficace de faire comparer deux collections pour l'égalité.

Un exemple je pense que ce serait une erreur est:

collection1 = {1, 2, 3, 3, 4}
collection2 = {1, 2, 2, 3, 4}

Qui serait égal avec ma mise en œuvre. Dois-je simplement compter le nombre de fois que chaque élément est trouvé et assurez-vous que les chiffres sont égaux dans les deux collections?

Les exemples sont en quelque sorte de C# (appelons-le pseudo-C#), mais donner votre réponse dans la langue que vous souhaitez, il n'a pas d'importance.

Remarque: j'ai utilisé des entiers dans les exemples de la simplicité, mais je veux être en mesure d'utiliser une référence de type objets trop (ils ne se comportent pas correctement, comme les clés, parce que la seule référence de l'objet de la comparaison, pas le contenu).

Comment au sujet de l'algorithme? Toutes les réponses liées par comparer quelque chose, générique listes de comparer linq etc. Vraiment nous n'avons promis à quelqu'un que nous ne seront jamais d'utiliser l'algorithme, comme un vieux façonné programmeur?
Vous n'êtes pas vérifier pour l'Égalité vous êtes à la vérification de l'Équivalence. C'est pinailleurs, mais une distinction importante. Et il y a longtemps. C'est une bonne Q+R.
Vous pouvez être intéressé par ce post, qui traite d'une version écoute de la fonction de dictionnaire méthode décrite ci-dessous. Une question avec le plus simple dictionnaire approches est qu'elles ne gèrent pas correctement les valeurs null parce que .NET le Dictionnaire de la classe ne permet pas les clés null.

InformationsquelleAutor mbillard | 2008-09-08

108

Il s'avère que Microsoft a déjà couverte, dans son cadre d'essais: CollectionAssert.AreEquivalent

Remarques

Deux collections sont équivalentes si elles
les mêmes éléments dans les mêmes
la quantité, mais dans n'importe quel ordre. Éléments
sont égales si leurs valeurs sont égales,
pas si ils font référence au même objet.

L'aide d'un réflecteur, j'ai modifié le code derrière AreEquivalent() pour créer un correspondant comparateur d'égalité. Il est plus complet que les réponses existantes, car elle prend les valeurs null en compte, met en œuvre IEqualityComparer et a une certaine efficacité et le bord en cas vérifie. de plus, il est Microsoft 🙂
```
public class MultiSetComparer<T> : IEqualityComparer<IEnumerable<T>>
{
private readonly IEqualityComparer<T> m_comparer;
public MultiSetComparer(IEqualityComparer<T> comparer = null)
{
m_comparer = comparer ?? EqualityComparer<T>.Default;
}
public bool Equals(IEnumerable<T> first, IEnumerable<T> second)
{
if (first == null)
return second == null;
if (second == null)
return false;
if (ReferenceEquals(first, second))
return true;
if (first is ICollection<T> firstCollection && second is ICollection<T> secondCollection)
{
if (firstCollection.Count != secondCollection.Count)
return false;
if (firstCollection.Count == 0)
return true;
}
return !HaveMismatchedElement(first, second);
}
private bool HaveMismatchedElement(IEnumerable<T> first, IEnumerable<T> second)
{
int firstNullCount;
int secondNullCount;
var firstElementCounts = GetElementCounts(first, out firstNullCount);
var secondElementCounts = GetElementCounts(second, out secondNullCount);
if (firstNullCount != secondNullCount || firstElementCounts.Count != secondElementCounts.Count)
return true;
foreach (var kvp in firstElementCounts)
{
var firstElementCount = kvp.Value;
int secondElementCount;
secondElementCounts.TryGetValue(kvp.Key, out secondElementCount);
if (firstElementCount != secondElementCount)
return true;
}
return false;
}
private Dictionary<T, int> GetElementCounts(IEnumerable<T> enumerable, out int nullCount)
{
var dictionary = new Dictionary<T, int>(m_comparer);
nullCount = 0;
foreach (T element in enumerable)
{
if (element == null)
{
nullCount++;
}
else
{
int num;
dictionary.TryGetValue(element, out num);
num++;
dictionary[element] = num;
}
}
return dictionary;
}
public int GetHashCode(IEnumerable<T> enumerable)
{
if (enumerable == null) throw new ArgumentNullException(nameof(enumerable));
int hash = 17;
foreach (T val in enumerable.OrderBy(x => x))
hash = hash * 23 + (val?.GetHashCode() ?? 42);
return hash;
}
}
```
Exemple d'utilisation:
```
var set = new HashSet<IEnumerable<int>>(new[] {new[]{1,2,3}}, new MultiSetComparer<int>());
Console.WriteLine(set.Contains(new [] {3,2,1})); //true
Console.WriteLine(set.Contains(new [] {1, 2, 3, 3})); //false
```
Ou si vous voulez juste pour comparer deux collections directement:
```
var comp = new MultiSetComparer<string>();
Console.WriteLine(comp.Equals(new[] {"a","b","c"}, new[] {"a","c","b"})); //true
Console.WriteLine(comp.Equals(new[] {"a","b","c"}, new[] {"a","b"})); //false
```
Enfin, vous pouvez utiliser un comparateur d'égalité de votre choix:
```
var strcomp = new MultiSetComparer<string>(StringComparer.OrdinalIgnoreCase);
Console.WriteLine(strcomp.Equals(new[] {"a", "b"}, new []{"B", "A"})); //true
```
- Merci pour la réponse, je ne savais pas Microsoft l'avait couvert. Pour la question, j'utilise en fait une variante de la réponse sur le dessus ce qui me permet de définir la façon dont les éléments sont comparés pour l'égalité et les chèques pour les valeurs null.
- Pas de problème. Il est également facile d'ajouter un IEqualityComparer<T> paramètre ci-dessus est mise en œuvre dans un but d'aide personnalisée à l'égalité de définition pour les T - En GetElementCounts(), il suffit d'utiliser le Dictionnaire ctor qui accepte IEqualityComparer<T>.
- NUnit a aussi un CollectionAssert.AreEquivalent() la méthode. Je suis curieux de savoir lequel est venu en premier, MS ou NUnit est.
- MME de la date de retour de visual studio 2005... ne sais pas à propos de NUnit
- Désolé, j'ai terminé oublié votre requête ! La plupart des straightforwad utilisation serait la comparaison de deux collections vous-même: new CollectionComparer<int>().Equals(intList1, intList2). Il existe également de nombreuses collections qui prennent un IEqualityComparer comme un ctor paramètre utilisé pour définir la signification de l'égalité dans le champ d'application de cette collection. Par exemple, voir: msdn.microsoft.com/en-us/library/ms132072.aspx
- C'est sympa car il fonctionne sur IEnumerable. Avec CollectionAssert.AreEqual et CollectionAssert.AreEquivalent, vous pouvez avoir à convertir un IEnumerable dans une ICollection. Par exemple, CollectionAssert.AreEquivalent( new HashSet<int>(nouveau [] {1, 2, 3}), new HashSet<int>(nouveau [] {1, 2, 3})); ne compile pas, mais CollectionAssert.AreEquivalent( new HashSet<int>(nouveau [] {1, 2, 3}).ToList(), new HashSet<int>(nouveau [] {1, 2, 3}).ToList()); va.
- Je ne suis pas sûr à 100% mais je pense que votre réponse viole de Microsoft conditions d'utilisation contre la rétro-ingénierie.
- Ce n'est pas la bonne solution . Cette solution compare des codes de hachage des objets , mais s'il vous PLAÎT NOTEZ que lors de l'implémentation d'un objet code de hachage de remplacer la méthode , vous avez la base de votre hash seulement la non-évolution des champs (ID) et pas sur tous les champs , pour cela vous disposez d'égal à égal . Donc cette méthode n'est pas bonne pour les cas où il existe des collections contient des objets de plusieurs champs .
- veuillez lire Eric Lippert est des lignes Directrices et des règles pour GetHashCode: blogs.msdn.com/b/ericlippert/archive/2011/02/28/... - plus précisément, la section "de la Règle: l'égalité des articles ont l'égalité des hachages"
- Bonjour, Ohad, Veuillez lire la suite de longs débats dans la rubrique stackoverflow.com/questions/371328/... Si vous modifiez un objet hashcode , tandis que ses dans un hashset il va interrompre avec le hashset bonne action et peut provoquer une exception . La règle est la suivante : Si deux objets sont égaux - ils doivent avoir le même code de hachage. Si deux objets ont la même hashcode - ce n'est pas un must pour eux d'être égaux. Hashcode doit rester la même pour l'ensemble de l'objet de la durée de vie! C'est pourquoi vous impelment ICompareable et IEqualrity .
- Et aussi , par Eric de l'article , il tient le même constat que moi : "Si deux objets sont égaux, alors ils doivent avoir le même code de hachage; ou, de manière équivalente, si deux objets ont différents codes de hachage alors ils doivent être inégale." Mais il ne dit pas que si ils ont le même hash codes qu'ils doivent être égaux , equalirtiy est relatif , il pourrait être même entité, mais pas le même état. Votre réponse est utilisé par le framework de test dans le cas où tous les objets de l'état est définitif , il n'est pas une bonne solution pour l'exécution. Cordialement , Jacques
- Peut-être que mon commentaire était trompeuse. Lorsqu'un dictionnaire rencontre un hashcode il contient déjà, il vérifie une véritable égalité avec un EqualityComparer (soit celui que vous avez fourni ou EqualityComparer.Default, vous pouvez vérifier Réflecteur ou de la source de référence pour vérifier cela). Vrai, si des objets (et plus précisément thier hashcode changements) alors que cette méthode est en cours d'exécution, puis les résultats sont inattendus, mais cela signifie simplement que cette méthode n'est pas thread-safe dans ce contexte.
- Je suis en désaccord , je pense que cela signifie que, pour que la méthode de travail que vous avez à mettre en œuvre obtenez hashcode dans le mauvais sens, fondé sur tous les champs de l'objet, parce que le but de cette méthode est de vérifier si deux séquences sont égaux en profondeur. Donc, si vous avez utilisé cette méthode vous avez eu à impelment gethashcode de manière à provoquer des échecs dans votre système. Alors que la bonne façon de mettre en œuvre gethashcode est uniquement fondée sur la non-modification de l'objet des domaines tels que l'ID de l'entité qui n'aura pas de les utiliser lors de la comparaison en profondeur de l'égalité de deux séquences .
- Supposons que x et y sont deux objets que l'on souhaite comparer. S'ils ont différents hashcodes, nous savons qu'ils sont différents (parce que l'égalité des articles égalité hashcodes), et de la mise en œuvre est correcte. Si elles ont le même hashcode, le dictionnaire de la mise en œuvre va vérifier pour la une véritable égalité à l'aide des EqualityComparer (ou EqualityComparer.Default si aucun n'est spécifié) et, de nouveau, la mise en œuvre est correcte.
- Si les collections contiennent les mêmes valeurs, mais dans un ordre différent alors qu'ils ne sont pas égaux, ils sont équivalent, - si le nom de la méthode a été public bool AreEquivalent(IEnumerable<T> first, IEnumerable<T> second) alors il n'y a pas de débat.
- la méthode doit être nommé Equals en raison de la IEqualityComparer<T> interface. Ce que vous devriez regarder est le nom de la comparer à lui-même. Dans ce cas, il est MultiSetComparer qui a du sens.
- Ah, oui, désolé. J'ai négligé l'implémentation de l'Interface, vous obligeant à appeler Equals. Merci.
- Le GetHashCode par Microsoft ici est optimisé pour le taux de collisions et pas la performance de GetHashCode appeler lui-même (par la commande de l'énumérable dans le GetHashCode méthode c'est lié à être sur le côté plus lent). Vous devez toujours penser à vos données et de décider par vous-même. Si la logique de commande est plus lente puis juste list.Sum(x => x.GetHashCode()) est bon pour aller (bien que les résultats dans plus de collisions depuis sommation n'est pas un bon code de hachage). Je dis à des tests pour vérifier vos données.
- Le GetHashCode mise en œuvre contient un bug: il va échouer si val est null (c'est à dire si la collection contient un null élément).
- bonne prise, fixe
- En tant qu'utilisateur nawfal indique, vous pourriez tout simplement la somme des codes de hachage que l'addition est commutative. Il semble que vous voulez l'extra hash collision de la protection fournie par votre propre méthode de hachage, mais vous pourriez vouloir inclure des valeurs null dans le calcul de hachage. Par exemple, hash = hash * 23 + (val != null ? val.GetHashCode() : 42).
- juste assez - mis à jour à nouveau
- merci beaucoup de votre réponse. mais comment pourrais-je réellement utiliser votre réponse à comparer deux listes d'objets personnalisés (sans tenir compte de l'ordre). J'ai déjà créé un IEqualityComparer pour ces deux objets. (dans mon cas, ils sont 3dPoints avec un x,y, et z de la valeur). des précisions très apprécié.
- J'ai ajouté un couple d'échantillons de la réponse, j'espère que efface de votre question. J'ai également ajouté un constructeur qui vous permet de passer des dans votre IEqualityComparer<T> (voir le dernier exemple). Alternativement, vous pourriez avoir votre classe en œuvre IEquatable<T> (ou moins de préférence Equals et GetHashCode) de sorte que lorsque le défaut générique comparateur d'égalité est utilisé par le dictionnaire interne (msdn.microsoft.com/en-us/library/x525za90(v=vs. 110).aspx), votre application sera utilisée (msdn.microsoft.com/en-us/library/ms224763(v=vs. 110).aspx).
InformationsquelleAutor Ohad Schneider
92

Un simple et assez efficace consiste à trier à la fois les collections et de les comparer pour l'égalité:
```
bool equal = collection1.OrderBy(i => i).SequenceEqual(
collection2.OrderBy(i => i));
```
Cet algorithme est O(N*logN), tandis que votre solution ci-dessus est O(N^2).

Si les collections ont certaines propriétés, vous pouvez être en mesure de mettre en œuvre une solution plus rapide. Par exemple, si deux de vos collections de hachage sont ensembles, ils ne peuvent pas contenir des doublons. Aussi, afin de vérifier si une table de hachage contient certains éléments est très rapide. Dans ce cas, un algorithme similaire à la vôtre serait susceptible d'être plus rapide.
- Vous avez juste à ajouter un à l'aide du Système.Linq; la première à le faire fonctionner
- si ce code est dans une boucle et collection1 sera mis à jour et collection2 reste intacte, de l'avis même lorsque les deux collections ont le même objet, débogueur se montrent faux pour cette "égalité" à la variable.
- Je crois que le Tri est nécessaire. Voir: dotnetfiddle.net/jA8iwE
InformationsquelleAutor
31

Créer un Dictionnaire "dict" et ensuite, pour chaque membre de la première collection, ne dict[membre]++;

Puis, en boucle au cours de la deuxième collection de la même manière, mais pour chaque membre de la dict[membre]--.

À la fin, en boucle sur tous les membres dans le dictionnaire:
```
    private bool SetEqual (List<int> left, List<int> right) {
if (left.Count != right.Count)
return false;
Dictionary<int, int> dict = new Dictionary<int, int>();
foreach (int member in left) {
if (dict.ContainsKey(member) == false)
dict[member] = 1;
else
dict[member]++;
}
foreach (int member in right) {
if (dict.ContainsKey(member) == false)
return false;
else
dict[member]--;
}
foreach (KeyValuePair<int, int> kvp in dict) {
if (kvp.Value != 0)
return false;
}
return true;
}
```
Edit: aussi loin Que je peux dire c'est du même ordre que le plus efficace algorithme. Cet algorithme est O(N), en supposant que le Dictionnaire utilise O(1) les recherches.
- C'est presque ce que je veux. Cependant, j'aimerais être capable de faire cela, même si je ne suis pas en utilisant des entiers. J'aimerais utiliser des objets de référence, mais ils ne se comportent pas correctement comme clés dans les dictionnaires.
- Mono, votre question est sans objet si vos Articles ne sont pas comparables. Si elles ne peuvent pas être utilisés comme clés dans le Dictionnaire, il n'existe aucune solution disponible.
- Je pense que Mono signifiait que les touches ne sont pas sortable. Mais Daniel solution est clairement destiné à être mis en œuvre avec une table de hachage, pas un arbre, et travailler aussi longtemps qu'il y a une équivalence de test et d'une fonction de hachage.
- Upvoted de cours pour les aider, mais pas possible, car il manque un point important (que je cache dans ma réponse).
- FWIW, vous pouvez simplifier votre dernière boucle foreach et de l'instruction de retour avec cette: return dict.All(kvp => kvp.Value == 0);
InformationsquelleAutor Daniel Jennings

C'est mon (fortement influencé par D. Jennings) générique de mise en œuvre de la méthode de comparaison (en C#):

///<summary>
///Represents a service used to compare two collections for equality.
///</summary>
///<typeparam name="T">The type of the items in the collections.</typeparam>
public class CollectionComparer<T>
{
///<summary>
///Compares the content of two collections for equality.
///</summary>
///<param name="foo">The first collection.</param>
///<param name="bar">The second collection.</param>
///<returns>True if both collections have the same content, false otherwise.</returns>
public bool Execute(ICollection<T> foo, ICollection<T> bar)
{
//Declare a dictionary to count the occurence of the items in the collection
Dictionary<T, int> itemCounts = new Dictionary<T,int>();
//Increase the count for each occurence of the item in the first collection
foreach (T item in foo)
{
if (itemCounts.ContainsKey(item))
{
itemCounts[item]++;
}
else
{
itemCounts[item] = 1;
}
}
//Wrap the keys in a searchable list
List<T> keys = new List<T>(itemCounts.Keys);
//Decrease the count for each occurence of the item in the second collection
foreach (T item in bar)
{
//Try to find a key for the item
//The keys of a dictionary are compared by reference, so we have to
//find the original key that is equivalent to the "item"
//You may want to override ".Equals" to define what it means for
//two "T" objects to be equal
T key = keys.Find(
delegate(T listKey)
{
return listKey.Equals(item);
});
//Check if a key was found
if(key != null)
{
itemCounts[key]--;
}
else
{
//There was no occurence of this item in the first collection, thus the collections are not equal
return false;
}
}
//The count of each item should be 0 if the contents of the collections are equal
foreach (int value in itemCounts.Values)
{
if (value != 0)
{
return false;
}
}
//The collections are equal
return true;
}
}

Beau travail, mais Remarque: 1. Contrairement à Daniel Jennings solution, Ce n'est pas O(N), mais plutôt de O(N^2), en raison de la fonction de recherche à l'intérieur de la boucle foreach sur la barre de la collecte; 2. Vous pouvez généraliser la méthode à accepter IEnumerable<T> au lieu de ICollection<T> avec aucune autre modification du code
The keys of a dictionary are compared by reference, so we have to find the original key that is equivalent to the "item" - ce n'est pas vrai. L'algorithme est basé sur de fausses hypothèses et alors que les travaux, il est terriblement inefficace.

InformationsquelleAutor mbillard

10

Vous pouvez utiliser un Hashset. Regardez les SetEquals méthode.
- bien sûr, à l'aide d'un HashSet n'assume pas de doublons, mais si on HashSet est la meilleure façon d'aller
InformationsquelleAutor Joel Gauvreau
5

EDIT: j'ai compris dès que j'ai posé que cela ne fonctionne vraiment que pour les ensembles -- il ne sera pas traiter correctement avec des collections qui ont des éléments en double. Par exemple, { 1, 1, 2 } et { 2, 2, 1 } sera considérée comme l'égale de cet algorithme de point de vue. Si vos collections sont des ensembles (ou de leur égalité peut être mesurée de cette façon), cependant, j'espère que vous trouverez ci-dessous utiles.

La solution que j'utilise est:
```
return c1.Count == c2.Count && c1.Intersect(c2).Count() == c1.Count;
```
Linq le dictionnaire de chose sous les couvertures, c'est aussi O(N). (Remarque, il est O(1) si les collections ne sont pas de la même taille).

J'ai fait un test de cohérence à l'aide de la "SetEqual" méthode proposée par Daniel, le OrderBy/SequenceEquals méthode proposée par Igor, et ma suggestion. Les résultats sont ci-dessous, montrant O(N*LogN) pour Igor et O(N) pour la mine et Daniel.

Je pense que la simplicité de l'Linq se croisent code en fait la meilleure solution.
```
__Test Latency(ms)__
N, SetEquals, OrderBy, Intersect    
1024, 0, 0, 0    
2048, 0, 0, 0    
4096, 31.2468, 0, 0    
8192, 62.4936, 0, 0    
16384, 156.234, 15.6234, 0    
32768, 312.468, 15.6234, 46.8702    
65536, 640.5594, 46.8702, 31.2468    
131072, 1312.3656, 93.7404, 203.1042    
262144, 3765.2394, 187.4808, 187.4808    
524288, 5718.1644, 374.9616, 406.2084    
1048576, 11420.7054, 734.2998, 718.6764    
2097152, 35090.1564, 1515.4698, 1484.223
```
- Le seul problème de ce code est qu'il ne fonctionne que lorsque l'on compare les types de valeur ou de comparer les pointeurs de types de référence. Je pourrais avoir deux instances différentes d'un même objet dans les collections, donc j'ai besoin d'être en mesure de préciser comment comparer chaque. Vous pouvez passer une comparaison délégué à la méthode intersect?
- Bien sûr, vous pouvez passer un comparateur délégué. Mais, remarque la limitation ci-dessus concernant les jeux que j'ai ajouté, ce qui impose une limite considérablement son applicabilité.
- L'Intersection de la méthode renvoie une collecte distincte. Donné a = {1,1,2} et b ={2,2,1}, un.Se croisent(b).Count() != un.Le comte, qui provoque votre expression correctement retourne la valeur false. {1,2}.Count != {1,1,2}.Comptez Voir lien[/link] (Notez que les deux côtés sont faits distincts avant la comparaison.)
InformationsquelleAutor
5

Dans le cas d'absence de répétitions et aucun ordre, les suivantes EqualityComparer peut être utilisé pour permettre à des collections comme les clés de dictionnaire:
```
public class SetComparer<T> : IEqualityComparer<IEnumerable<T>> 
where T:IComparable<T>
{
public bool Equals(IEnumerable<T> first, IEnumerable<T> second)
{
if (first == second)
return true;
if ((first == null) || (second == null))
return false;
return first.ToHashSet().SetEquals(second);
}
public int GetHashCode(IEnumerable<T> enumerable)
{
int hash = 17;
foreach (T val in enumerable.OrderBy(x => x))
hash = hash * 23 + val.GetHashCode();
return hash;
}
}
```
Ici est le ToHashSet() de la mise en œuvre que j'ai utilisé. Le algorithme de code de hachage vient d'être Efficace Java (par voie de Jon Skeet).
- Quel est le point de Serializable pour Comparer la classe? 😮 vous pouvez Également modifier l'entrée de ISet<T> pour exprimer qu'elle est destinée à des ensembles (c'est à dire pas de doublons).
- merci, je ne sais pas ce que je pensais quand j'ai marqué, il Serializable... Comme pour ISet, l'idée ici était de traiter la IEnumerable comme un ensemble (parce que vous avez un IEnumerable pour commencer), mais compte tenu de l'0 upvotes dans plus de 5 ans qui ne peuvent pas avoir été la plus forte d'idée 😛
InformationsquelleAutor Ohad Schneider
4
```
static bool SetsContainSameElements<T>(IEnumerable<T> set1, IEnumerable<T> set2) {
var setXOR = new HashSet<T>(set1);
setXOR.SymmetricExceptWith(set2);
return (setXOR.Count == 0);
}
```
Solution .NET 3.5 et le System.Collections.Generic espace de noms. Selon Microsoft, SymmetricExceptWith est un O(n + m) opération, avec n représentant le nombre d'éléments dans le premier set et m représentant le nombre d'éléments dans la seconde. Vous pouvez toujours ajouter un comparateur d'égalité à cette fonction si nécessaire.

InformationsquelleAutor palswim

Si vous utilisez Shouldly, vous pouvez utiliser ShouldAllBe avec Contient.

collection1 = {1, 2, 3, 4};
collection2 = {2, 4, 1, 3};
collection1.ShouldAllBe(item=>collection2.Contains(item)); //true

Et enfin, vous pouvez écrire une extension.

public static class ShouldlyIEnumerableExtensions
{
public static void ShouldEquivalentTo<T>(this IEnumerable<T> list, IEnumerable<T> equivalent)
{
list.ShouldAllBe(l => equivalent.Contains(l));
}
}

Mise à JOUR

Un paramètre facultatif existe sur ShouldBe méthode.

collection1.ShouldBe(collection2, ignoreOrder: true); //true

Je viens de trouver sur dernière version qu'il y a un paramètre bool ignoreOrder sur doit être méthode.

InformationsquelleAutor Pier-Lionel Sgard

Pourquoi ne pas l'utiliser .À l'exception de()

//Create the IEnumerable data sources.
string[] names1 = System.IO.File.ReadAllLines(@"../../../names1.txt");
string[] names2 = System.IO.File.ReadAllLines(@"../../../names2.txt");
//Create the query. Note that method syntax must be used here.
IEnumerable<string> differenceQuery =   names1.Except(names2);
//Execute the query.
Console.WriteLine("The following lines are in names1.txt but not names2.txt");
foreach (string s in differenceQuery)
Console.WriteLine(s);

http://msdn.microsoft.com/en-us/library/bb397894.aspx

Except de ne pas travailler pour le comptage des articles en double. Il sera de retour le cas pour les ensembles {1,2,2} et {1,1,2}.
vous pourriez faire un ".Distinct()" d'abord supprimer tous les doublons
L'OP demande [1, 1, 2] != [1, 2, 2] . À l'aide de Distinct serait de les rendre égaux.

InformationsquelleAutor Korayem

Un double poste de sortes, mais découvrez ma solution pour comparer des collections. C'est assez simple:

Cela permettra d'effectuer une comparaison d'égalité quel que soit l'ordre:

var list1 = new[] { "Bill", "Bob", "Sally" };
var list2 = new[] { "Bob", "Bill", "Sally" };
bool isequal = list1.Compare(list2).IsSame;

Il s'agira de vérifier pour voir si les articles ont été ajoutés /supprimés:

var list1 = new[] { "Billy", "Bob" };
var list2 = new[] { "Bob", "Sally" };
var diff = list1.Compare(list2);
var onlyinlist1 = diff.Removed; //Billy
var onlyinlist2 = diff.Added;   //Sally
var inbothlists = diff.Equal;   //Bob

Cela permettra de voir quels sont les articles dans le dictionnaire changé:

var original = new Dictionary<int, string>() { { 1, "a" }, { 2, "b" } };
var changed = new Dictionary<int, string>() { { 1, "aaa" }, { 2, "b" } };
var diff = original.Compare(changed, (x, y) => x.Value == y.Value, (x, y) => x.Value == y.Value);
foreach (var item in diff.Different)
Console.Write("{0} changed to {1}", item.Key.Value, item.Value.Value);
//Will output: a changed to aaa

Post Original ici.

InformationsquelleAutor user329244

1

erickson est presque droite: puisque vous voulez match sur le compte des doublons, vous voulez un Sac. En Java, cela ressemble à quelque chose comme:
```
(new HashBag(collection1)).equals(new HashBag(collection2))
```
Je suis sûr que C# est un Ensemble intégré de mise en œuvre. Je voudrais utiliser que la première; si la performance est un problème, vous pouvez toujours utiliser un Ensemble différent de la mise en œuvre, mais d'utiliser la même interface.

InformationsquelleAutor James A. Rosen

Voici ma méthode d'extension variante de ohadsc réponse, dans le cas où c'est utile à quelqu'un

static public class EnumerableExtensions 
{
static public bool IsEquivalentTo<T>(this IEnumerable<T> first, IEnumerable<T> second)
{
if ((first == null) != (second == null))
return false;
if (!object.ReferenceEquals(first, second) && (first != null))
{
if (first.Count() != second.Count())
return false;
if ((first.Count() != 0) && HaveMismatchedElement<T>(first, second))
return false;
}
return true;
}
private static bool HaveMismatchedElement<T>(IEnumerable<T> first, IEnumerable<T> second)
{
int firstCount;
int secondCount;
var firstElementCounts = GetElementCounts<T>(first, out firstCount);
var secondElementCounts = GetElementCounts<T>(second, out secondCount);
if (firstCount != secondCount)
return true;
foreach (var kvp in firstElementCounts)
{
firstCount = kvp.Value;
secondElementCounts.TryGetValue(kvp.Key, out secondCount);
if (firstCount != secondCount)
return true;
}
return false;
}
private static Dictionary<T, int> GetElementCounts<T>(IEnumerable<T> enumerable, out int nullCount)
{
var dictionary = new Dictionary<T, int>();
nullCount = 0;
foreach (T element in enumerable)
{
if (element == null)
{
nullCount++;
}
else
{
int num;
dictionary.TryGetValue(element, out num);
num++;
dictionary[element] = num;
}
}
return dictionary;
}
static private int GetHashCode<T>(IEnumerable<T> enumerable)
{
int hash = 17;
foreach (T val in enumerable.OrderBy(x => x))
hash = hash * 23 + val.GetHashCode();
return hash;
}
}

Comment est-ce effectuer, des idées?
Je n'utilise que cela pour les petites collections, et n'ont pas pensé à Big-O de la complexité ou de faire de l'analyse comparative. HaveMismatchedElements seul est O(M*N) de sorte qu'il ne peut pas effectuer bien pour de grandes collections.
Si IEnumerable<T>s sont des requêtes, puis de l'appel Count() n'est pas une bonne idée. Ohad originale de répondre à l'approche de vérifier s'ils sont ICollection<T> est la meilleure idée.

InformationsquelleAutor Eric J.

Voici une solution qui est une amélioration par rapport à cette une.

public static bool HasSameElementsAs<T>(
this IEnumerable<T> first, 
IEnumerable<T> second, 
IEqualityComparer<T> comparer = null)
{
var firstMap = first
.GroupBy(x => x, comparer)
.ToDictionary(x => x.Key, x => x.Count(), comparer);
var secondMap = second
.GroupBy(x => x, comparer)
.ToDictionary(x => x.Key, x => x.Count(), comparer);
if (firstMap.Keys.Count != secondMap.Keys.Count)
return false;
if (firstMap.Keys.Any(k1 => !secondMap.ContainsKey(k1)))
return false;
return firstMap.Keys.All(x => firstMap[x] == secondMap[x]);
}

InformationsquelleAutor N73k

0

Il y a beaucoup de solutions à ce problème.
Si vous ne vous souciez pas des doublons, vous n'avez pas à trier à la fois. Assurez-vous d'abord qu'ils ont le même nombre d'éléments. Après que sorte l'une de ces collections. Puis binsearch chaque élément de la deuxième collection dans la collection triée. Si vous ne trouvez pas un élément donné d'arrêt et de renvoyer false.
La complexité de cette:
- tri de la première collection: NLog(N)
- la recherche de chaque élément de la deuxième à la première: NLOG(N)
si vous vous retrouvez avec 2*N*LOG(N) en supposant qu'elles correspondent et que vous regardez tout. Ceci est similaire à la complexité du tri à la fois. Aussi cela vous donne l'avantage à arrêter plus tôt si il y a une différence.
Cependant, gardez à l'esprit que si les deux sont triés avant d'étape dans cette comparaison et vous essayez de tri par utiliser quelque chose comme un qsort, le tri sera plus cher. Il y a des optimisations pour cela.
Une autre alternative, ce qui est idéal pour les petites collections où vous savez que la gamme des éléments est d'utiliser un masque de bits d'index. Cela vous donnera un O(n) de la performance.
Une autre alternative est d'utiliser une table de hachage et de le regarder. Pour les petites collections, il est généralement beaucoup mieux de faire le tri ou le masque de bits d'index. Table de hachage ont l'inconvénient de pire localité donc, gardez cela à l'esprit.
De nouveau, c'est que si vous ne vous souciez pas des doublons. Si vous voulez en compte les doublons aller avec tri à la fois.

InformationsquelleAutor
0

Dans de nombreux cas, la seule réponse appropriée est celle d'Igor Ostrovsky , d'autres réponses sont basées sur des objets de code de hachage.
Mais lorsque vous générez un code de hachage pour un objet, vous le faites uniquement basé sur son IMMUABLE champs - comme Id de l'objet champ (dans le cas d'une base de données d'entité) -
Pourquoi est-il important de remplacer GetHashCode lorsque la méthode Equals est substituée?

Cela signifie , que si vous comparez deux collections , le résultat pourrait être vrai de la méthode de comparaison, même si les champs des différents éléments ne sont pas égaux .
Profondeur de comparer des collections , vous devez utiliser Igor méthode et de mettre en œuvre IEqualirity .

Lisez les commentaires de moi et monsieur.Schnider est sur ses plus voter post.

James

InformationsquelleAutor James Roeiter

Permettant de doublons dans les IEnumerable<T> (si les jeux ne sont pas souhaitables\possibles) et "ignorant la commande", vous devriez être en mesure d'utiliser un .GroupBy().

Je ne suis pas un expert sur la complexité des mesures, mais ma compréhension rudimentaire, c'est que ce doit être en O(n). Je comprends O(n^2) comme provenant de l'exécution d'une O(n) fonctionnement à l'intérieur d'un autre O(n) comme ListA.Where(a => ListB.Contains(a)).ToList(). Chaque élément de ListB est évalué pour l'égalité contre chaque élément de ListA.

Comme je l'ai dit, ma compréhension de la complexité est limitée, donc corrigez-moi si je me trompe.

public static bool IsSameAs<T, TKey>(this IEnumerable<T> source, IEnumerable<T> target, Expression<Func<T, TKey>> keySelectorExpression)
{
//check the object
if (source == null && target == null) return true;
if (source == null || target == null) return false;
var sourceList = source.ToList();
var targetList = target.ToList();
//check the list count :: { 1,1,1 } != { 1,1,1,1 }
if (sourceList.Count != targetList.Count) return false;
var keySelector = keySelectorExpression.Compile();
var groupedSourceList = sourceList.GroupBy(keySelector).ToList();
var groupedTargetList = targetList.GroupBy(keySelector).ToList();
//check that the number of grouptings match :: { 1,1,2,3,4 } != { 1,1,2,3,4,5 }
var groupCountIsSame = groupedSourceList.Count == groupedTargetList.Count;
if (!groupCountIsSame) return false;
//check that the count of each group in source has the same count in target :: for values { 1,1,2,3,4 } & { 1,1,1,2,3,4 }
//key:count
//{ 1:2, 2:1, 3:1, 4:1 } != { 1:3, 2:1, 3:1, 4:1 }
var countsMissmatch = groupedSourceList.Any(sourceGroup =>
{
var targetGroup = groupedTargetList.Single(y => y.Key.Equals(sourceGroup.Key));
return sourceGroup.Count() != targetGroup.Count();
});
return !countsMissmatch;
}

InformationsquelleAutor Josh Gust

0

Cette solution simple les forces de l' (IEnumerable's de type générique de mettre en œuvre IComparable. En raison de
OrderBydéfinition.

Si vous ne voulez pas faire une telle hypothèse, mais encore envie d'utiliser cette solution, vous pouvez utiliser le morceau de code suivant :
```
bool equal = collection1.OrderBy(i => i?.GetHashCode())
.SequenceEqual(collection2.OrderBy(i => i?.GetHashCode()));
```
InformationsquelleAutor Jo Ham

Vous devez vous connecter pour publier un commentaire.