Bon intersection d'une collection de jeux en C++

J'ai une collection de std::set. Je veux trouver l'intersection de tous les ensembles dans cette collection, le plus rapidement. Le nombre d'ensembles dans la collection est généralement très faible (~5-10), et le nombre d'éléments dans chaque jeu est est généralement de moins de 1000, mais peut parfois aller jusqu'à environ 10000. Mais j'ai besoin de faire ces intersections des dizaines de milliers de fois, aussi vite que possible. J'ai essayé de référence quelques méthodes comme suit:

En place d'intersection dans un std::set objet qui, initialement, les exemplaires de la première série. Alors pour la suite des séries, on itère sur tous les élément de lui-même et l'ith ensemble de la collection, et supprime les éléments de lui-même, en tant que de besoin.
À l'aide de std::set_intersection dans un temporaire std::set, swap de contenu pour un jeu actuel, puis de nouveau trouver l'intersection de l'ensemble actuel avec le jeu suivant et insérez-la dans le temp ensemble, et ainsi de suite.
Manuellement itérer sur tous les éléments de toutes les séries comme dans le 1), mais à l'aide d'un vector que le conteneur de destination au lieu de std::set.
Même que dans le 4, mais en utilisant une std::list au lieu d'un vector, soupçonnant un list permet d'avoir plus rapidement des suppressions dans le milieu.
À l'aide de hachage de jeux (std::unordered_set) et la vérification de tous les éléments de tous les ensembles.

Comme il s'est avéré, à l'aide d'un vector est légèrement plus rapide lorsque le nombre d'éléments dans chaque set est petit, et list est légèrement plus rapide pour les grands ensembles. En place à l'aide de set est considérablement plus lent que les deux, suivie par set_intersection de hachage et de jeux. Est-il un algorithme plus rapide/discbased/astuces pour accomplir cela? Je peux poster des extraits de code si nécessaire. Merci!

La question dépend vraiment de savoir si ou non vous attendre à trouver beaucoup d'éléments communs ou non, que cela modifie le "meilleur" de la structure que l'on peut venir avec. Par exemple, un 6ème méthode pourrait être d'utiliser simplement et std::unordered_map et de compter le nombre d'occurrences de chacun des éléments. Il est O(N) dans le nombre total d'éléments. Ensuite, vous choisissez simplement les éléments qui ont un total égal au nombre de jeux, O(M) est le nombre d'éléments distincts. Aucune idée de comment il pourrait effectuer.
Je vois. Je vais opter pour cette solution, bien que je soupçonne, il ne sera pas plus rapide qu'un std::list en raison de hachage et autres frais généraux. Merci!
Cette méthode va donner le jeu en non trié. Heureusement, j'ai deux cas d'utilisation, qui nécessite le résultat dans l'ordre de tri, et une qui ne l'est pas. Si cette méthode est assez rapide, je peux l'utiliser au moins pour le cas où l'intersection n'est pas nécessaire d'être triés.
J'ai essayé cette approche, et pour mes données, ce n'était que légèrement plus vite que mon approche 5 (en utilisant unordered_set).
Vous pouvez essayer cette idée. Pire des cas linéaire (ne peut pas éviter que, si les jeux ont pour la plupart les mêmes éléments), mais si l'intersection est petit, il peut être beaucoup plus rapide.

OriginalL'auteur Paresh | 2012-10-13

algorithm c++set-intersection stl

10

Vous pourriez vouloir essayer une généralisation de std::set_intersection(): l'algorithme est d'utiliser des itérateurs pour tous les jeux:
1. Si un itérateur a atteint le end() de sa correspondante, vous avez terminé. Ainsi, on peut supposer que tous les itérateurs sont valides.
2. Prendre la première itérateur de valeur comme le prochain candidat de la valeur x.
3. Déplacer dans la liste des itérateurs et std::find_if() le premier élément au moins aussi important que x.
4. Si la valeur est plus grande que x en faire le nouveau candidat de la valeur et de la recherche de nouveau dans la séquence des itérateurs.
5. Si tous les itérateurs sont sur la valeur x vous avez trouvé un élément de l'intersection: l'Enregistrer, de la incrément de tous les itérateurs de début plus de.
Je ne recommanderais pas std::find_if lorsque l'on travaille avec std::set, après tout, std::set caractéristiques à la fois std::lower_bound et std::upper_bound avec sont généralement plus rapide.
pas dans ce cas, find_if, en moyenne, de ne jamais avoir à l'avance de plus de deux éléments et est donc S (1), tandis que ???er_bound est S (log n).
Évidemment, cela dépend de l'interface de l'algorithme, et je voudrais les faire fonctionner sur une séquence de paires d'entrée itérateurs: std::set_intersection() fait aussi bien. Fait intéressant, je pense que la complexité de votre approche suggérée est O (n log n) * m) : oùn est la taille maximale des décors et des m est le nombre de jeux. Mon algorithme a une complexité de O(n * m). Je pense que mon approche de la gagne.
Merci! Je ne comprenais pas pourquoi find_if, en moyenne, de ne jamais avoir à l'avance de plus de deux éléments?
comme Paresh je me demande où les 2 éléments viennent (j'ai peut-être raté quelque chose d'évident). Il me semble qu'il dépendrait de la façon dont les données sont distribuées, ne serait-il pas ? Par exemple supposons que j'ai un ensemble de 100 éléments et un autre de 1000 éléments couvrant la même gamme. Ensuite, dans la moyenne, j'ai besoin de sauter sur les 10 éléments de l'ensemble à chaque étape.

OriginalL'auteur Dietmar Kühl
5

De nuit est un bon conseiller et je pense que j'ai peut-être une idée 😉
- De la mémoire est beaucoup plus lent que le CPU de ces jours, si toutes les données s'inscrit dans le cache L1 pas une grosse affaire, mais il facilement les déversements de plus de L2 ou L3: 5 séries de 1000 éléments est déjà 5000 éléments, à savoir 5000 nœuds, et un ensemble de nœud contient au moins 3 pointeurs + l'objet (c'est à dire, au moins de 16 octets sur une machine 32 bits et de 32 octets sur une machine 64 bits) => c'est au moins de 80k de la mémoire et de la récente Processeurs seulement 32k pour le L1D nous sommes donc déjà à se déverser dans L2
- La précédente fait est aggravé par le problème que les ensembles de nœuds sont probablement dispersés autour de la mémoire, et pas étroitement emballés ensemble, ce qui signifie que la partie de la ligne de cache est rempli complètement indépendants des trucs. Ce pourrait être atténué par fourni un allocateur qui garde les nœuds proches les uns des autres.
- Et cela est encore aggravé par le fait que les Processeurs sont beaucoup mieux à des lectures séquentielles (où ils peuvent prélecture de la mémoire avant d'en avoir besoin, de sorte que vous ne pas attendre que ça) plutôt que de lectures aléatoires (et une structure en arbre conduit malheureusement à tout à fait les lectures aléatoires)
C'est pourquoi, où les vitesses de question, un vector (ou peut-être un deque sont si grandes structures: ils jouent très bien avec de la mémoire. En tant que tel, je recommanderais certainement à l'aide de vector que nos structures intermédiaires; bien que les soins doivent être prises pour ne jamais insérer/supprimer à partir d'une extrémité pour éviter les délocalisations.

Alors j'ai pensé à une approche assez simple:
```
#include <cassert>
#include <algorithm>
#include <set>
#include <vector>
//Do not call this method if you have a single set...
//And the pointers better not be null either!
std::vector<int> intersect(std::vector< std::set<int> const* > const& sets) {
for (auto s: sets) { assert(s && "I said no null pointer"); }
std::vector<int> result; //only return this one, for NRVO to kick in
//0. Check obvious cases
if (sets.empty()) { return result; }
if (sets.size() == 1) {
result.assign(sets.front()->begin(), sets.front()->end());
return result;
}
//1. Merge first two sets in the result
std::set_intersection(sets[0]->begin(), sets[0]->end(),
sets[1]->begin(), sets[1]->end(),
std::back_inserter(result));
if (sets.size() == 2) { return result; }
//2. Merge consecutive sets with result into buffer, then swap them around
//   so that the "result" is always in result at the end of the loop.
std::vector<int> buffer; //outside the loop so that we reuse its memory
for (size_t i = 2; i < sets.size(); ++i) {
buffer.clear();
std::set_intersection(result.begin(), result.end(),
sets[i]->begin(), sets[i]->end(),
std::back_inserter(buffer));
swap(result, buffer);
}
return result;
}
```
Il semble correct, je ne peux pas garantir sa vitesse bien que, évidemment.

Merci! La compacité de mémoire, c'est la raison, j'ai essayé l'option 3 dans la question d'origine: à l'aide d'un vector comme intermédiaire conteneur, tout comme vous avez fait. La différence étant que vous avez utilisé la set_intersection, qui nécessite deux vectors, tandis que je continuais à 1 vecteur, avec l'inconvénient que j'ai eu à effacer dans le milieu. Même si votre approche doit idéalement avoir été plus rapide, je suppose que le complexe de facteurs comme la mémoire contiguë, la mise en cache (tableau 1 vs 2), etc font de ce plus lent que les options 3 et 4 que j'ai essayé ci-dessus. Bien sûr, le kilométrage peut varier en fonction des données.
+1 pour penser en termes de mémoire et de mise en cache, et de donner une bonne explication! Comme une note de côté, je suis envisage d'utiliser des vecteurs au lieu de std::set, et de l'insérer dans l'ordre de tri dans les vecteurs si c'est comparable. La compacité peut raisonnablement rapide, et les intersections serait certainement plus rapide.

OriginalL'auteur Matthieu M.

Vous devez vous connecter pour publier un commentaire.