C++ itérateurs & optimisation en boucle

Je vois beaucoup de code c++ qui ressemble à ceci:

for( const_iterator it = list.begin(),
     const_iterator ite = list.end();
     it != ite; ++it)

Contrairement à la version la plus concise:

for( const_iterator it = list.begin();
     it != list.end(); ++it)

Il n'y aura aucune différence de vitesse entre ces deux conventions? Naïvement le premier sera un peu plus rapide depuis la liste.fin() n'est appelée qu'une seule fois. Mais depuis l'itérateur est const, il semble que le compilateur va tirer de ce test de la boucle, de générer l'équivalent de l'assemblée pour les deux.

La déclaration de " ite " serait une erreur de syntaxe si votre première version est "pour (const_iterator i = liste.begin(), e = liste.end(); i != e; ++i)". Ce n'est qu'un peu plus de caractères que la deuxième forme, donc je viens de l'utiliser par défaut.
Maintenant en C++11, il est également for(auto it : list) qui est essentiellement le second. Mais c'est beaucoup plus agréable.
gamme pour les boucles d'éléments, pas itérateur positions, donc l'équivalent est for ( const auto& element : list )
si vous voulez être technique, ce n'est pas le même, parce que les ni sont des itérateurs. Essayez d'accéder à element->whatever
hmm? Je pense que c'est le même point, j'ai été ce qui implique que la variable de boucle est un élément, par conséquent doit utiliser element.whatever. Droit?
Je l'ai ajouté dans pas parce que c'est exactement baisse de remplacement, mais parce que c'est un moyen d'obtenir la même fonctionnalité/résultat final simplement et facilement.
la gamme de boucle est équivalent à la première forme, pas le second formulaire (en.cppreference.com/w/cpp/language/range-for)
mais const_iterator signifie seulement "vous ne pouvez pas modifier le conteneur par le biais de cet itérateur", pas " rien d'autre ne peut modifier le conteneur à l'intérieur de cette boucle.

InformationsquelleAutor Quantum7 | 2009-04-28

c++coding-style compiler-construction iterator optimization

29

Je ne mentionnerai que pour mémoire que la norme C++ mandats que l'appel begin() et end() sur tout type de conteneur (soit vector, list, map etc.) doit prendre que la constante de temps. Dans la pratique, ces appels seront presque certainement être incorporé à un seul pointeur de la comparaison, si vous compilez avec des optimisations activées.

Noter que cette garantie ne vaut pas nécessairement pour plus de fournisseur "conteneurs" qui ne sont pas réellement obéir aux exigences formelles de la un conteneur énoncées dans le chapitre 23 de la norme (par exemple, la liste liée individuellement slist).
- ++ À partir de ce que j'entends, je vois, les itérateurs parfois/souvent de ne pas obtenir incorporé à l'appel de code libre, et même si ils prennent de la constante de temps, le temps peut être carrément cochon. Bien sûr, cela peut être bien, jusqu'à ce que vous vous retrouvez dans une situation de stress, et alors il peut être votre plus grand coût. Morale: être conscient de la possibilité.
- La pêche Yip fait un bon point -- inline ne peut se produire de façon réaliste pour les fonctions incluses dans la même unité de traduction (par exemple via un fichier d'en-tête). Je serais curieux de voir un extrait de code où un conteneur STL s end() est (reproductible) de ne pas être incorporé par une récente (< 5 ans) compilateur.
- FWIW la perte de la fonction inline travers les unités de traduction peut être récupéré à l'aide de gcc -flto drapeau pour activer le Lien-l'optimisation du temps'. Clang est un fonctionnalité similaire.
InformationsquelleAutor j_random_hacker
43

Les deux versions ne sont pas le même. Dans la deuxième version, il compare l'itérateur contre list.end() à chaque fois, et ce list.end() donne pourrait changer au cours de la boucle. Maintenant, bien sûr, vous ne pouvez pas modifier list par le biais de la const_iterator it; mais rien n'empêche de code à l'intérieur de la boucle juste des appels de méthodes sur list directement et de mutation, ce qui pourrait (selon le type de structure de données list est) changement de la fin de l'itérateur. Il pourrait donc être incorrecte dans certaines circonstances, pour stocker la fin de l'itérateur d'avance, parce que peut-être plus la bonne fin de l'itérateur par le temps que vous obtenez pour elle.
- +1. Bon point sur la possibilité de modification de la liste, qui sera uniquement gérée correctement par le deuxième extrait de code.
- si la liste est un std::vector, par exemple, le changement à l'intérieur de la boucle entraînera la nullité de tous les itérateurs, rendant ainsi les deux boucles incorrect.
- C'est la vraie réponse.
InformationsquelleAutor newacct
11

Le premier sera probablement presque toujours être plus rapide, mais si vous pensez que cela fera une différence, toujours profil pour voir qui est plus rapide, et de combien.

Le compilateur sera probablement en mesure de l'inclure l'appel à end() dans les deux cas, même si end() est assez compliqué, il peut choisir de ne pas l'inclure. Toutefois, la clé de l'optimisation est de savoir si ou non le compilateur peut effectuer boucle d'extraction de code invariant. Je voudrais poser que dans la plupart des cas, le compilateur ne peut pas être certain que la valeur de end() ne changera pas au cours de l'itération de la boucle, dans ce cas, il n'a pas le choix mais pour appeler end() après chaque itération.
- Je suis d'accord. Il est préférable d'écriture facile à lire le premier code. Ensuite, s'il y a des problèmes de performance - profil du code, assurez-vous que la condition de boucle est de goulot d'étranglement, et ensuite seulement de le réécrire en plus vite, mais un peu moins lisible version.
- Le Timing de ces deux approches est une bonne idée. Vous ne pas sais que le premier sera plus rapide, car chaque appel pour mettre fin à() sera presque certainement être incorporé dans un seul pointeur de comparaison. Aussi, la norme C++ garantit que l'appel à la fin() sur un conteneur est une constante de temps de l'opération, de sorte qu'il ne peut jamais être "assez compliqué".
InformationsquelleAutor Adam Rosenfield
8

Je choisirais l'option qui est la plus concise et lisible. N'essayez pas de deuxième deviner le compilateur et les optimisations qu'il pourrait effectuer. Rappelez-vous que la grande majorité de votre code aura absolument aucun effet sur la performance globale, de sorte que si c'est dans une critique pour les performances de la section de code devrait vous passez l'heure de profil et de choisir une bonne source efficace de la représentation.

Avec une référence spécifique à votre exemple, la première version fait un copie de la end() itérateur, en invoquant n'importe quel code s'exécute pour le constructeur de copie de l'itérateur de l'objet. STL en général, les conteneurs contiennent en ligne end() fonctions, de sorte que le compilateur a beaucoup de chances pour optimiser la deuxième version, même si vous n'êtes pas d'essayer de l'aider à sortir. Laquelle est la meilleure? Les mesurer.

InformationsquelleAutor Greg Hewgill
6

Vous pouvez faire la première version plus concise et obtenez le meilleur des deux:
```
for( const_iterator it = list.begin(), ite = list.end();
     it != ite; ++it)
```
P. S. Les itérateurs ne sont pas const, ils sont des itérateurs pour const référence. Il y a une grosse différence.

InformationsquelleAutor Mark Ransom
6

Considérons cet exemple:
```
for (const_iterator it = list.begin(); it != list.end(); ++list)
{
    if (moonFull())
        it = insert_stuff(list);
    else
        it = erase_stuff(list);
}
```
dans ce cas, vous avez BESOIN de la liste d'appels.fin() dans la boucle, et le compilateur ne va pas optimiser tout ça.

D'autres cas où le compilateur peut prouver que la fin() est retourne toujours la même valeur, l'optimisation peut prendre place.

Si nous parlons des conteneurs STL, que je pense que tout bon compilateur peut optimiser loin multiples end() appels lorsque plusieurs end() appels n'est pas nécessaire pour la programmation logique. Toutefois, si vous avez un conteneur personnalisé et la mise en œuvre de end() n'est pas dans la même unité de traduction, que l'optimisation devront avoir lieu au moment de la liaison. Je sais très peu de choses sur le lien à l'optimisation du temps, mais je parie que la plupart des linkers ne fera pas une telle optimisation.
- Mais si vous êtes en utilisant un itérateur faire une boucle sur la liste, ne devriez-vous pas également utiliser l'itérateur de modifier la liste? Sinon, vous pourriez obtenir bizarre problèmes de concurrence que les données et les itérateur sortir de la synchronisation. C'est peut-être un plus gros problème en Java où les itérateurs ont plus de substance.
- Oui, vous avez raison. Il aura plus de sens d'écrire insérer__stuff(il, liste)...mais le point que j'essayais de faire passer le fait que la liste pourrait changer à l'intérieur de la boucle et de la liste.fin() doit être appelée pour chaque boucle.
- +1. Votre remarque au sujet de l'in-lining passe uniquement lorsque la définition de la fin() apparaît dans la même unité de traduction est parfaitement logique pour moi. Je me demande si c'est ce que d'autres font face quand ils se plaignent de l'compilateur manquant "évident" inlining des opportunités...?
- C'est de l'OMI, la réponse correcte. Vous pouvez même reproduire les multiples appels à la fin() simplement par l'appel à la non-fonction inline: "pour (auto it = liste.cbegin(); it != liste.cend(); ++liste) { (...) foo(); }`
InformationsquelleAutor Shing Yip
4

Aah, les gens semblent être de faire des suppositions. Ouvrez votre code dans le débogueur & vous verrez que les appels à begin(), end (), etc tout est optimisé loin. Il n'est pas nécessaire pour utiliser la version 1. Testé avec le compilateur Visual C++ fullopt.
- Cela va dépendre du compilateur, le conteneur, et les paramètres d'optimisation. Le meilleur de l'enlever tout doute.
- Il dépend de la boucle en question. J'ai trouvé plusieurs cas dans le passé où MSVC++ n'est pas d'optimiser le second cas que dans le premier, même quand il semble assez évident qu'il le devrait.
- Mais de tirer une conclusion à partir d'un seul point de données n'est en fait pas mieux que d'essayer de deviner.
InformationsquelleAutor user15071
4

Le compilateur pourrait être en mesure d'optimiser la deuxième à la première, mais qui suppose que les deux sont équivalents, c'est à dire fin() est en fait constante. Un peu plus problématique, c'est que le compilateur peut être impossible d'en déduire que la fin de l'itérateur est constante en raison d'une possible aliasing. Cependant, en supposant que l'appel à la fin() est incorporé, la différence est juste une mémoire de charge.

Noter que cela suppose que l'optimiseur est activé. Si l'optimiseur n'est pas activé, comme souvent dans les versions de débogage, puis la seconde formulation impliquera N-1 plus d'appels de fonction. Dans les versions actuelles de Visual C++, versions de débogage sera également entraîner des hits en raison de la fonction du prologue/épilogue vérifications et plus lourd de débogage des itérateurs. Par conséquent, dans la STL lourd code, par défaut le premier cas peut empêcher le code de manière disproportionnée lente dans les versions debug.

D'Insertion et de retrait à l'intérieur de la boucle sont une possibilité, comme d'autres l'ont souligné, mais avec ce style de boucle je trouve que peu probable. Pour une chose, nœud à base de conteneurs -- list, set, map -- n'invalident pas la fin() sur chaque opération. Deuxièmement, l'itérateur incrément fréquemment doit être déplacé dans la boucle afin d'éviter l'invalidation des problèmes:
```
 //en supposant que la liste -- ne cache end() pour vecteur 
iterator it c.begin ()) à la fin(c.end()); 
while(it != fin) { 
si (should_remove(*it)) 
c' = c.erase(it); 
d'autre 
++c'; 
}
```
Ainsi, je considère une boucle qui prétend fin d'appel() pour muter-cours-boucle raisons et encore a ++dans la boucle d'en-tête pour être suspect.

InformationsquelleAutor Avery Lee
2
1. De prélever l'échantillon dans des conditions de stress et de voir si vous êtes en * * * * * * ce code très souvent ***.
  Si non, il n'a pas d'importance.
2. Si vous êtes, regardez le démontage, ou en une seule étape.
  C'est comment vous pouvez dire qui est plus rapide.
Vous devez être prudent de ces itérateurs.
Ils peuvent obtenir optimisé à nice code machine, mais, assez souvent ils ne le font pas, et de devenir le temps de porcs.

** (Où "en" signifie réellement, ou être appelé à partir d'elle.)

*** (Où "souvent" signifie un pourcentage important de l'époque.)

AJOUTÉ: Ne vous contentez pas de voir combien de fois par seconde le code est exécuté. Il pourrait être de 1 000 fois par seconde et encore être en utilisant moins de 1% du temps.

N'avez pas de temps combien de temps cela prend soit. Il pourrait prendre un millième de seconde et encore moins de 1% du temps.

On pourrait multiplier les deux, pour obtenir une meilleure idée, mais qui ne fonctionne que si ils ne sont pas trop biaisée.

L'échantillonnage de la pile d'appel vous dira si elle utilise un pourcentage élevé suffisamment de temps à la matière.

InformationsquelleAutor Mike Dunlavey
1

J'ai toujours préféré le premier. Mais avec les fonctions inline, les optimisations du compilateur et relativement plus petite de la taille du conteneur ( dans mon cas, c'est normalement max de 20 à 25 points) il ne veut vraiment pas faire de grande différence par rapport à la performance.
```
const_iterator it = list.begin();
const_iterator endIt = list.end();

for(; it != endIt ; ++it)
{//do something
}
```
Mais récemment, je suis en utilisant plus de std::for_each partout où c'est possible. Son optimisé en boucle qui permet de rendre le code plus lisible que les deux autres.
```
std::for_each(list.begin(), list.end(), Functor());
```
Je vais utiliser la boucle uniquement lorsque std::for_each ne peut pas être utilisé. (par ex: std::for_each ne vous permet pas de briser la boucle, sauf si une exception est levée).
- Je n'étais pas au courant de cette fonction. Il semble comme un appel de fonction aura toujours des frais généraux par rapport intégré "pour", même si c'est très lisible. Même avec une macro de mise en œuvre, il ne pouvait pas être plus rapide qu'une boucle for. Cela fait de moi souhaite que je pourrais utiliser python pour ce projet (malheureusement mon employeur détermine c++).
- Bien sûr, il ne peut pas être rapide qu'une boucle (car intérieurement il est traduit dans une boucle), mais il est presque certainement pas plus lent.
- semble comme un appel de fonction aura toujours des frais généraux C'est tout à fait faux; inline est une chose qui existe.
InformationsquelleAutor aJ.
0

En théorie, le compilateur peut optimiser la deuxième version dans le premier (en supposant que le conteneur ne change pas au cours de la boucle, évidemment).

Dans la pratique, j'ai trouvé plusieurs cas similaires lors de l'analyse des critiques de code où mon compilateur a totalement échoué à hisser invariant calculs de boucle conditions. Ainsi, alors que le un peu plus concis version est bien dans la plupart des cas, je ne vous fiez pas au compilateur de faire les choses sensibles avec elle pour un cas où je suis très inquiète à propos de la performance.
- Je pense que le problème n'est pas de savoir si le compilateur est assez intelligent pour détecter la fin() est invariant et de hisser hors de la boucle (ce qui nécessite une relativement intelligent compilateur) -- c'est de savoir si l'appel à la fin() peut être incorporé (qui ne requièrent pas une telle puce compilateur), étant donné que le code à l'intérieur de l'extrémité() sera généralement très court et simple, par exemple un seul pointeur de comparaison pour les std::vector ou std::list.
InformationsquelleAutor Peter

Vous devez vous connecter pour publier un commentaire.