Efficace non signé-à-signé fonte d'éviter la mise en œuvre définies par le comportement

Je veux définir une fonction qui prend un unsigned int comme argument et renvoie un int congrus modulo UINT_MAX+1 pour l'argument.

Une première tentative pourrait ressembler à ceci:

int unsigned_to_signed(unsigned n)
{
    return static_cast<int>(n);
}

Mais comme toute langue, l'avocat sait, la conversion de non signé signé pour des valeurs plus grandes que INT_MAX la mise en œuvre est définie.

Je veux mettre en œuvre la présente tel que (a) il ne repose que sur le comportement mandaté par la spécification; et (b) il compile dans un no-op sur toute machine moderne et d'optimisation du compilateur.

Comme pour bizarre machines... Si il n'y a pas signé d'int congrus modulo UINT_MAX+1 pour les unsigned int, disons que je veux lancer une exception. Si il n'y a plus d'un (je ne suis pas sûr que c'est possible), disons que je veux la plus grande.

OK, deuxième tentative:

int unsigned_to_signed(unsigned n)
{
    int int_n = static_cast<int>(n);

    if (n == static_cast<unsigned>(int_n))
        return int_n;

    //else do something long and complicated
}

Je n'ai pas beaucoup de soins au sujet de l'efficacité quand je ne suis pas sur un deux-système du complément, car à mon humble avis, c'est peu probable. Et si mon code devient un goulet d'étranglement sur l'omniprésence d'un signe-amplitude systèmes de 2050, eh bien, je parie que quelqu'un peut comprendre et d'optimiser l'époque.

Maintenant, cette deuxième tentative est assez proche de ce que je veux. Bien que le casting de int la mise en œuvre est définie pour certains intrants, les acteurs de unsigned est garanti par la norme afin de préserver la valeur modulo UINT_MAX+1. Si la condition n'vérifier exactement ce que je veux, et compiler en rien sur tout le système je suis susceptible de rencontrer.

Cependant... je suis encore un casting pour int sans vérifier d'abord si elle va invoquer la mise en œuvre définies par le comportement. Sur un hypothétique système en 2050, elle pourrait faire de qui-sait-quoi. Donc, disons que je veux éviter.

Question: Quelle devrait être ma "troisième tentative de" ressembler?

Pour résumer, je veux:

Fonte de unsigned int signé int
De préserver la valeur mod UINT_MAX+1
Invoquer standard mandat comportement
Compiler dans un no-op sur un deux-complément de la machine avec le compilateur optimisant

[Mise à jour]

Permettez-moi de donner un exemple pour montrer pourquoi ce n'est pas une question triviale.

Envisager un hypothétique implémentation C++ avec les propriétés suivantes:

sizeof(int) est égal à 4
sizeof(unsigned) est égal à 4
INT_MAX est égal à 32767
INT_MIN est égal à -2³² + 32768
UINT_MAX est égale à 2³² - 1
Arithmétique sur int modulo 2³² (dans la gamme INT_MIN par INT_MAX)
std::numeric_limits<int>::is_modulo est vrai
Casting unsigned n int préserve la valeur de 0 <= n <= 32767 et les rendements zéro sinon

Sur cette hypothétique mise en œuvre, il y a exactement un int valeur congruents (mod UINT_MAX+1) pour chaque unsigned valeur. Donc ma question serait bien définis.

Je prétends que cet hypothétique C++ mise en œuvre pleinement conforme à la C++98, C++03, et de C++11 cahier des charges. J'avoue que je n'ai pas mémorisé chaque parole de tous... Mais je crois que j'ai lu les sections pertinentes soigneusement. Donc, si vous voulez que j'accepte votre réponse, vous devez (a) citer un spec que les règles de cette hypothétique mise en œuvre ou (b) les manipuler correctement.

En effet, une réponse correcte doit gérer chaque hypothétique mise en œuvre permise par la norme. C'est ce qui "invoquer standard mandat comportement" signifie, par définition.

D'ailleurs, notez que std::numeric_limits<int>::is_modulo est totalement inutile, ici, pour de multiples raisons. Pour une chose, il peut être true même si non signé-à-signé jette de ne pas travailler pour de grandes valeurs non signées. Pour l'autre, il peut être true même sur un complément ou un signe-amplitude systèmes, si l'arithmétique est simplement modulo l'ensemble de l'intervalle entier. Et ainsi de suite. Si votre réponse dépend is_modulo, c'est mal.

[Mise à jour 2]

hvd réponse m'a appris quelque chose: Mon hypothétique implémentation C++ pour les entiers est pas permise par les techniques modernes de C. C99 et C11 normes sont très spécifiques au sujet de la représentation des entiers signés; en effet, ils ne permettent que deux en complément, ceux-compléter et signer magnitude (section 6.2.6.2 paragraphe (2); ).

Mais le C++ n'est pas C. Comme il s'avère, de ce fait, se trouve au cœur même de ma question.

Le C++98 norme a été basé sur la plus ancienne C89, qui dit (section 3.1.2.5):

Pour chaque entier signé types, il existe un correspondant (mais
différents) type entier non signé (désigné par le mot-clé
non signé), qui utilise la même quantité de stockage (y compris le signe
de l'information) et a les mêmes exigences alignement. La gamme de
non négatif valeurs d'un entier signé de type est un sous-groupe de la
correspondant de type entier non signé, et la représentation de la
même valeur dans chaque type est le même.

C89 ne dit rien sur un seul bit de signe ou permettant seulement deux-complément de/ceux-complément/signe-amplitude.

Le C++98 standard adopté cette langue presque mot à mot (section 3.9.1 paragraphe (3)):

Pour chaque entier signé types, il existe un correspondant
(mais différentes) type entier non signé: "unsigned char", "unsigned short int", "unsigned int", et "unsigned long int", chacun de
qui occupe la même quantité de stockage et a le même alignement
exigences (3.9) que le type entier signé ; que
est, chaque entier signé de type a, l'objet même de la représentation comme
son correspondant entier non signé type. La gamme de positif
les valeurs d'un entier signé de type est un sous-groupe de correspondants
type entier non signé, et la valeur de la représentation de chaque
correspondant signed/unsigned type doit être le même.

Le C++03 standard utilise essentiellement identique de la langue, comme le fait de C++11.

Pas de C++ standard spec limite son entier signé auprès de tout C spec, autant que je puis dire. Et il n'y a rien de mandater un seul bit de signe ou quelque chose du genre. Tout ce qu'elle dit, c'est que non négatif entiers signés doivent être un sous-groupe de correspondants non signé.

Donc, encore une fois je demande que INT_MAX=32767 avec INT_MIN=-2³²+32768 est autorisée. Si votre réponse suppose sinon, elle est incorrecte, à moins que vous citez un C++ standard prouver que j'ai tort.

En fait, je l'ai dit exactement ce que je veux dans ce cas: "Si il n'y a pas signé d'int congrus modulo UINT_MAX+1 pour les unsigned int, disons que je veux lancer une exception." C'est, je veux le "droit" signé int à condition qu'il existe. Si elle n'existe pas-comme cela pourrait se produire dans le cas, par exemple, de rembourrage bits ou en complément des représentations -- je veux détecter et de les traiter pour l'invocation de la fonte.
désolé, pas sûr de savoir comment j'ai manqué.
Btw, je pense que dans votre hypothétique délicate de la mise en œuvre int a besoin d'au moins 33 bits pour le représenter. Je sais que c'est seulement une note de bas de page, de sorte que vous pouvez faire valoir qu'il n'est pas normatif, mais je pense que la note de bas de page 49 en C++11 est prévu pour être vrai (puisque c'est la définition d'un terme utilisé dans le standard) et il n'est pas en contradiction avec quelque chose explicitement mentionné dans le texte normatif. Donc, toutes les valeurs négatives doivent être représentée par une séquence de bits dont le bit le plus élevé est défini, et par conséquent, vous ne pouvez pas cram 2^32 - 32768 en 32 bits. Non pas que votre argument repose en aucune manière sur la taille de int.
Et concernant vos modifications dans hvd réponse, je pense que vous avez mal interprété la note 49. Vous dites que signe-amplitude est interdit, mais il ne l'est pas. Vous avez lu comme: "les valeurs représentées par les bits suivants sont additifs, commencer par 1, et (sont multipliés par les intégrales puissance de 2, sauf peut-être pour le bit à la position la plus haute)". Je crois qu'il faut le lire, "les valeurs représentées par une succession de bits (sont additifs, commencer par 1, et sont multipliés par les intégrales de puissance de 2), sauf peut-être pour le bit à la position la plus élevée". C'est, tous les paris sont éteints si le bit est défini.
Votre interprétation est peut-être exacte. Si oui, il n'règle mon hypothétique... Mais il introduit également un très vaste nombre de possibilités, faisant de cette question extrêmement difficile de répondre. En fait, cela ressemble à un bug dans la spec pour moi. (Apparemment, le C comité pensais et il fixe seront raffinés en C99. Je me demande pourquoi C++11 ne pas adopter leur approche?)
Si une application utilise un " complément ou le signe-amplitude format, sont des opérateurs booléens définie comme l'exploitation des matières bits, ou sont-ils défini comme un fonctionnement dans un mode compatible avec le complément à deux de format (dans ce cas, la seule signification de la représentation devrait être (1), le comportement de ~INT_MAX, et (2), les syndicats ou d'autres techniques d'aliasing types.
Je pense que tu veux dire "les opérateurs au niveau du bit", pas "opérateurs Booléens". (Le dernier fonctionner sur les Booléens; par exemple, && ou ||.) Je crois que la réponse à votre question est que les opérateurs au niveau du bit (comme & et |) fonctionnent sur la "valeur de la représentation de l'entier. Si vous souhaitez assurer un comportement cohérents avec en complément à deux sur le format" vous avez besoin de jeter les arguments de leurs les formulaires non signés.
En d'autres termes, étant donné int n;, réellement portable calcul de "n mod 16" [par opposition à "n reste 16"] nécessite (unsigned)n & 15 plutôt que de simplement n & 15? Je me demande combien de code utilise délibérément des opérateurs au niveau du bit sur autre chose que complément à deux valeurs? Je souhaite que le C comité des normes permettrait d'ajouter les manières de préciser qu'un programme doit utiliser notamment entier de la sémantique ou de refuser de compilation; comme il est, de la langue, il est beaucoup plus facile d'écrire du code qui semble correct, mais s'arrête sur quelques raisonnable implémentations que d'écrire du code portable.

InformationsquelleAutor Nemo | 2012-10-31

c++language-lawyer

62

Expansion sur user71404 réponse:
```
int f(unsigned x)
{
    if (x <= INT_MAX)
        return static_cast<int>(x);

    if (x >= INT_MIN)
        return static_cast<int>(x - INT_MIN) + INT_MIN;

    throw x; //Or whatever else you like
}
```
Si x >= INT_MIN (garder les règles de la promotion de l'esprit, INT_MIN est converti en unsigned), puis x - INT_MIN <= INT_MAX, si ce n'aurez pas de débordement.

Si ce n'est pas évident, jetez un oeil à la demande "Si x >= -4u, puis x + 4 <= 3.", et gardez à l'esprit que INT_MAX sera au moins égal à la valeur mathématique de INT_MIN - 1.

Sur les systèmes les plus courants, où !(x <= INT_MAX) implique x >= INT_MIN, l'optimiseur doit être en mesure (et sur mon système, en est capable) pour supprimer la deuxième case, de déterminer que les deux return déclarations peuvent être compilés dans le même code, et de supprimer la première case de trop. L'assembly généré inscription:
```
__Z1fj:
LFB6:
    .cfi_startproc
    movl    4(%esp), %eax
    ret
    .cfi_endproc
```
L'hypothétique mise en œuvre dans votre question:
- INT_MAX est égal à 32767
- INT_MIN est égal à -2³² + 32768
n'est pas possible, n'a donc pas besoin d'une attention particulière. INT_MIN sera égale à -INT_MAX, ou à -INT_MAX - 1. Cela découle de C représentation des types d'entiers (6.2.6.2), ce qui nécessite n bits à la valeur de bits, un bit à bit de signe, et n'autorise qu'un seul piège de la représentation (non compris les représentations qui sont invalides en raison de rembourrage bits), à savoir celui qui serait autrement représentent négatif zéro /-INT_MAX - 1. C++ ne permet pas à un nombre entier quelconque des représentations au-delà de ce que le C permet.

Mise à jour: Microsoft compilateur ne semble pas remarquer que x > 10 et x >= 11 tester la même chose. Il ne génère le code désiré si x >= INT_MIN est remplacé par x > INT_MIN - 1u, qu'il peut détecter comme la négation de x <= INT_MAX (sur cette plate-forme).

[Mise à jour à partir interlocuteur (Nemo), de l'élaboration de notre discussion ci-dessous]

Je crois que cette réponse fonctionne dans tous les cas, mais compliqué raisons. J'ai la chance d'attribution de la prime à cette solution, mais j'ai envie de capturer tous les détails croustillants dans le cas où quelqu'un se soucie.

Nous allons commencer avec le C++11, section 18.3.3:

Table 31 décrit l'en-tête <climits>.

...

Le contenu est le même que la bibliothèque Standard C de l'en-tête <limits.h>.

Ici, un Standard "C" signifie que le C99, dont les spécifications limite sérieusement la représentation des entiers signés. Ils sont comme des entiers non signés, mais avec un peu dédié à "signer" et de zéro ou plusieurs bits dédiés à "padding". Le rembourrage bits ne contribuent pas à la valeur de l'entier, et le bit de signe contribue seulement que deux en complément, ceux-complément, ou le signe-amplitude.

Depuis C++11 hérite de la <climits> macros de C99, INT_MIN est soit -INT_MAX ou -INT_MAX-1, et hvd code est garanti pour fonctionner. (Notez que, en raison du rembourrage, INT_MAX pourrait être beaucoup moins que UINT_MAX/2... Mais grâce à la manière signé->unsigned jette travail, cette réponse poignées fine).

C++03/C++98 est plus délicat. Il utilise la même formulation pour hériter <climits> de "Standard C", mais maintenant Standard "C" signifie C89/C90.

Tous ces -- C++98, C++03, C89/C90 -- le libellé je donne à ma question, mais également inclure ce (C++03 section 3.9.1 paragraphe 7):

Les représentations de l'ensemble des types de définir des valeurs par l'utilisation d'un
pure binaire système de numération.(44) [Exemple: International
Norme permet complément de 2, 1 de complément et signé de l'ampleur
représentations pour les types intégraux.]

Note de bas de page (44) définit la "pure numération binaire du système":

Une position de représentation pour les entiers qui utilise les chiffres binaires 0
et 1, dans lequel les valeurs représentées par une succession de bits sont
additif, commencer par 1, et sont multipliés par les intégrales
puissance de 2, sauf peut-être pour le bit à la position la plus haute.

Ce qui est intéressant à propos de cette formulation est qu'il est en contradiction avec lui-même, parce que la définition de "pure numération binaire système" n'a pas permis un signe et l'ampleur de la représentation! Il ne permet pas de haut bits d'avoir, disons, la valeur -2^n-1 (complément à deux) ou -(2^n-1-1) (ceux complément). Mais il n'y a pas de valeur pour le peu élevé que les résultats dans le signe et l'ampleur.

De toute façon, mon "hypothétique mise en œuvre" n'est pas considéré comme "pur binaire" en vertu de cette définition, il est exclu.

Cependant, le fait que la haute bit est spécial signifie que nous pouvons l'imaginer contribuant aucune valeur: Une petite valeur positive, énorme valeur positive, de petite valeur négative, ou à une énorme valeur négative. (Si le bit de signe peut contribuer -(2^n-1-1), pourquoi pas(2^n-1-2)? etc.)

Donc, imaginons un entier signé de représentation qui affecte une wacky valeur le "signe" peu.

Une petite valeur positive pour le bit de signe entraînerait une plage positive int (éventuellement aussi grand que unsigned), et hvd du code gère cela très bien.

Une énorme valeur positive pour le bit de signe entraînerait int avoir un maximum de plus de unsigned, ce qui est interdit.

Une énorme valeur négative pour le bit de signe entraînerait int représentant un non-contiguë à une gamme de valeurs, et d'autres libellé dans la spécification des règles de sortir.

Enfin, que diriez-vous d'un bit de signe qui contribue à une petite quantité négative? Pourrions-nous avoir un 1 dans le "bit de signe" contribuer, disons, de -37 à la valeur de l'int? Alors INT_MAX serait (dire) 2³¹-1 et INT_MIN serait -37?

Cela entraînerait un certains nombres d'avoir deux représentations... Mais ceux-compléter donne deux représentations à zéro, et qui est autorisé conformément à la "Exemple". Nulle part dans la spec dire que c'est le zéro seulement entier qui peut avoir deux représentations. Je pense donc que cette nouvelle hypothétique est autorisé par les spécifications.

En effet, une valeur négative de -1 en bas à -INT_MAX-1 semble être admissible en tant que valeur pour le "bit de signe", mais rien de plus petite taille (de peur que la fourchette de non-contigus). En d'autres termes, INT_MIN peut-être quelque chose de -INT_MAX-1 à -1.

Maintenant, devinez quoi? Pour la deuxième distribution dans hvd du code pour éviter de mise en œuvre définies par le comportement, nous avons juste besoin x - (unsigned)INT_MIN inférieure ou égale à INT_MAX. Nous avons seulement montré INT_MIN est au moins -INT_MAX-1. Évidemment, x est au plus UINT_MAX. Le moulage d'un nombre négatif non signé est le même que l'ajout de UINT_MAX+1. Mettre tout cela ensemble:
```
x - (unsigned)INT_MIN <= INT_MAX
```
si et seulement si
```
UINT_MAX - (INT_MIN + UINT_MAX + 1) <= INT_MAX
-INT_MIN-1 <= INT_MAX
-INT_MIN <= INT_MAX+1
INT_MIN >= -INT_MAX-1
```
Ce dernier est ce que nous a juste montré, de sorte que même dans cette perverse cas, le code fonctionne réellement.

Qui épuise toutes les possibilités, mettant ainsi un terme à cette extrêmement exercice académique.

Bas de ligne: Il y a quelques gravement sous-comportement spécifié pour les entiers signés en C89/C90 qui a hérité du C++98/C++03. Il est fixé en C99, et de C++11 indirectement hérite de la résoudre en intégrant <limits.h> de C99. Mais même en C++11 conserve l'auto-contradictoire "pure représentation binaire" les mots...
- Question mise à jour. Je suis vers le bas-droit de vote de cette réponse (pour l'instant) pour dissuader les autres... je les nations unies-vers le bas-vote plus tard parce que la réponse est intéressante. (Bon, pour le C, mais mauvais pour le C++. Je pense.)
- La norme s'applique à C++ dans ce cas; à tout le moins, les valeurs de <limits.h> sont définis dans la norme C++ comme ayant la même signification que dans la norme, de sorte que tous C en matière de INT_MIN et INT_MAX sont hérités en C++. Vous avez raison que C++03 désigne C90, et C90 est imprécis sur les permis entier des représentations, mais le C99 changement (hérité au moins via <limits.h> par le C++11, je l'espère aussi de façon plus simple) de la limiter à ces trois était l'un que codifié existant pratique: pas d'autres implémentations de l'existence.
- Je suis d'accord que le sens de INT_MIN etc. sont héritées de C. Mais cela ne signifie pas que le valeurs sont. (En effet, comment pourraient-ils, car chaque réalisation est différente?) Votre inférence que INT_MIN est à moins de 1 de -INT_MAX dépend de la formulation qui ne semble tout simplement pas en C++ spec. Ainsi, tandis que le C++ n'héritent de la signification sémantique des macros, des spec ne pas fournir (ou d'en hériter) de la formulation qui prend en charge votre inférence. Cela semble être une erreur dans le C++ spec qui empêche de pleinement conforme efficace non signé-à-signé en fonte.
- Si vous (peut-être correctement) affirment que le C++ permet à d'autres représentations, puis sur une telle mise en œuvre, je prétends que INT_MIN n'est pas nécessaire pour être le minimum représentable valeur de type int, parce que pour ce que C est en cause, si le type ne correspond pas aux exigences de int, le C standard ne peut pas couvrir que la mise en œuvre de quelque manière que ce soit, et le C++ standard ne fournit pas de définition autre que "ce que le C standard dit". Je vais vérifier si il y a une explication.
- Il y a aussi en C++11 [de base.fondamentaux]p7: "Les représentations de l'ensemble des types de définir des valeurs par l'utilisation d'un pur binaire système de numération. [Exemple: la présente Norme Internationale permet complément de 2, 1 de complément et signé ampleur des représentations pour les types intégraux. --fin du modèle de ]" Ce serait encore interdire hypothétique mise en œuvre, mais il serait peut-être permettre à d'autres personnes qui ne sont pas autorisés dans les C.
- Je dirais que mon hypothétique représentation est", une pure numération binaire du système". C'est juste biaisé un peu drôle :-). Pourtant, depuis le C++ spec ne dis <climits> a le même contenu, comme "la Norme d'en-tête C <limits.h>", il s'ensuit que INT_MIN etc. doit être valide pour C. Donc, qui prend soin de C++11 (mais pas du C++03, pour qui "Standard C" signifiait C90). Je vais probablement le vent jusqu'à accepter cette réponse.
- Hm, la lecture de la C99 spec de nouveau, je ne vois pas le libellé exigeant tout au plus un "piège de la représentation". (En fait, il permet explicitement d'un ou plusieurs bits comme "padding" dans la signature de la représentation.) Ainsi les biais de mon exemple l'autre sens (INT_MIN=-32768, INT_MAX=2^32-32769) et je pense qu'il pourrait même se conformer à la C les spécifications...
- Il y a une note en bas de page liée à la "pure binaire système de numération": "Une position de représentation pour les entiers qui utilise les chiffres binaires 0 et 1, dans lequel les valeurs représentées par une succession de bits sont additifs, commencer par 1, et sont multipliés par les intégrales puissance de 2, sauf peut-être pour le bit à la position la plus haute." En d'autres termes, au moins tous, sauf un, sont des valeurs de bits, et un bit peut avoir une signification particulière (comme le bit de signe); je crois que n'autorise pas votre mise en œuvre, car elle ne découle pas de la valeur à partir de la valeur de bits lorsque le bit est à 0.
- Oui, C permet integer types de rembourrage bits, mais ils ne jouent ici aucun rôle. Un entier signé de type avec une valeur de 31 bits, 1 bit de signe, et 232 padding bits doivent avoir exactement 232 ou exactement 232-1 des valeurs valides. Les bits sont des bits de padding ne dépend pas de la valeur.
- Mais vous avez raison, j'ai été bâclée avec ma formulation n'. Remarque: inclus dans ma réponse.
- 6.2.6.2 (2) il est clair que certains de la valeur des bits dans la représentation non signée peut être padding bits de la signature de la représentation: "S'il y a valeur M bits dans le type signé et N pour un type non signé, alors M ≤ N". (Donc N-M compte rembourrage bits plus signe bits.) Vous pouvez m'avoir sur pur "binaire" en C++11 :-). Mais je ne pense pas -INT_MAX est nécessairement dans un délai de 1 de INT_MIN par le C spec.
- Oui, C permet, par exemple, int avoir valeur de 31 bits, 1 bit de signe, et 32 bits de padding, tandis que unsigned a 64 de la valeur des bits. Je crois qu'il permet également int avoir valeur de 31 bits, 1 bit de signe, pas de rembourrage bits, tandis que unsigned a valeur de 31 bits et un peu de rembourrage. J'ai pris ces implémentations en compte lors de venir avec ma réponse. Pour leur mise en œuvre, INT_MIN sera toujours soit -INT_MAX ou -INT_MAX - 1; INT_MAX juste ne pas être égale à UINT_MAX / 2.
- Ok, je vois. Donc C99 est OK, C++11 est OK, et C90 et C++03 sont sous-spécifiés. À moins que quelqu'un trouve une solution viable pour chacun d'eux, vous obtiendrez la 500 bounty. Merci pour la discussion
- Content que ça aide, et je suis très curieux de voir si quelqu'un arrive avec un bon C90/C++03 solution. La seule chose que je puisse arriver, c'est ce que j'ai dans cette réponse, combiné avec un vérifiez que la valeur de retour de nouveau converti unsigned est égal au paramètre, et si non, force brutale, c', la vérification de chaque valeur possible de INT_MIN tout le chemin à INT_MAX. Mais c'est évidemment une très mauvaise solution. 🙂
- Avez-vous l'esprit si je modifier votre réponse à ajouter un peu d'élaboration (des références, etc.), y compris certaines des citations que nous avons couvert ici? Je veux que la Q&A à être correct dans le cas où quelqu'un tombe sur ça dans l'avenir. Ou préférez-vous que je viens de modifier ma question?
- Pas de problème, n'hésitez pas à modifier.
- L'OP (ou sa source!) construit un exemple de contrecarrer votre réponse. Je crois qu'elle a été ajoutée après ma réponse (pas sûr, mais je pense que je l'aurais remarqué que!). De toute façon, pensez à votre expression static_cast<int>(x - INT_MIN). Il est évalué seulement si x >= INT_MIN, après la promotion de INT_MIN non signé. Avec l'OP INT_MIN = -2^n + 32768, la promotion des rendements 32768, donc, mettons x lors d'une série 1 m + 32768. En soustrayant INT_MIN qui est semblable à 32768, puis donne un tour de 1 million de dollars. Qui est à l'extérieur de l'OP de l'exemple int de gamme, donc le casting appelle impl. def. comportement... 🙁
- C'était l'un des points abordés dans ces commentaires, qui Nemo a inclus dans ma réponse: C++ ne permet pas la mise en œuvre, donc, aucune attention particulière n'est nécessaire.
- C'est magnifique. Aucune idée de comment j'ai raté cette question à l'époque.
InformationsquelleAutor
17

Ce code s'appuie uniquement sur le comportement, mandaté par la spécification, de sorte que la condition (a) est facilement satisfaite:
```
int unsigned_to_signed(unsigned n)
{
  int result = INT_MAX;

  if (n > INT_MAX && n < INT_MIN)
    throw runtime_error("no signed int for this number");

  for (unsigned i = INT_MAX; i != n; --i)
    --result;

  return result;
}
```
Il n'est pas si facile avec la condition (b). Cette compile dans un no-op avec gcc 4.6.3 (-Os, -O2-O3) et avec clang 3.0 (-Os, -O, -O2-O3). Intel 12.1.0 refuse d'optimiser cette. Et je n'ai aucune info à propos de Visual C.
- OK, c'est génial. Je souhaite que je pourrais diviser la prime de 80:20... je soupçonne le compilateur raisonnement est: Si la boucle ne s'arrête pas, result débordements; débordement d'entier n'est pas défini; par conséquent, la boucle s'arrête; c'est pourquoi i == n à la cessation d'emploi; par conséquent result est égal à n. J'ai toujours préférer hvd de réponse (pour les non-pathologiques du comportement de la moins-smart compilateurs), mais cela mérite plus de votes.
- Unsigned sont définis à modulo. La boucle est également garanti la fin car n est certaine valeur non signée et i doit finalement atteindre chaque valeur non signée.
InformationsquelleAutor Evgeny Kluev
3

Vous pouvez indiquer explicitement au compilateur ce que vous voulez faire:
```
int unsigned_to_signed(unsigned n) {
  if (n > INT_MAX) {
    if (n <= UINT_MAX + INT_MIN) {
      throw "no result";
    }
    return static_cast<int>(n + INT_MIN) - (UINT_MAX + INT_MIN + 1);
  } else {
    return static_cast<int>(n);
  }
}
```
Compile avec gcc 4.7.2 pour x86_64-linux (g++ -O -S test.cpp) à
```
_Z18unsigned_to_signedj:
    movl    %edi, %eax
    ret
```
- UINT_MAX est une expression de type unsigned int, et qui rend l'ensemble de votre static_cast<int>(n + INT_MIN) - (UINT_MAX + INT_MIN + 1) de ce type. Il devrait être possible de corriger cela, et je m'attends à encore être compilé le même.
- Cette réponse est incorrecte. Voir mes commentaires sur hvd réponse.
InformationsquelleAutor user71404
2

Si x est notre entrée...

Si x > INT_MAX, nous voulons trouver une constante k tels que 0 < x - k*INT_MAX < INT_MAX.

C'est facile -- unsigned int k = x /INT_MAX;. Alors, laissez unsigned int x2 = x - k*INT_MAX;

Nous pouvons maintenant lancer x2 à int en toute sécurité. Laissez int x3 = static_cast<int>(x2);

Maintenant, nous voulons soustraire quelque chose comme UINT_MAX - k * INT_MAX + 1 de x3, si k > 0.

Maintenant, sur un 2s, le système du complément, tant que x > INT_MAX, cela fonctionne à:
```
unsigned int k = x / INT_MAX;
x -= k*INT_MAX;
int r = int(x);
r += k*INT_MAX;
r -= UINT_MAX+1;
```
Noter que UINT_MAX+1 est zéro en C++ de la garantie, la conversion en int a été un noop, et nous avons soustrait k*INT_MAX ensuite ajouté sur le dos "de la même valeur". Donc acceptable optimiseur doit être en mesure d'effacer tout ce qui tomfoolery!

Qui laisse le problème de x > INT_MAX ou pas. Eh bien, nous créons 2 branches, l'une avec x > INT_MAX, et l'autre sans. L'un sans ne un détroit exprimés, ce qui le compilateur optimise pour un noop. L'un avec ... un noop après l'optimiseur est fait. Le smart optimiseur se rend compte que les deux branches de la même chose, et les gouttes de la branche.

Des questions: si UINT_MAX est vraiment grand par rapport à INT_MAX, le ci-dessus peut ne pas fonctionner. Je suis en supposant que k*INT_MAX <= UINT_MAX+1 implicitement.

Nous pourrions probablement l'attaque avec un peu d'énumérations comme:
```
enum { divisor = UINT_MAX/INT_MAX, remainder = UINT_MAX-divisor*INT_MAX };
```
qui travaillent à 2 et 1 à 2s, le système du complément, je crois (sommes-nous garanties pour que les mathématiques au travail? C'est difficile...), et de faire de la logique sur la base de ces facilement optimiser loin sur la non-2s compléter des systèmes de...

Ceci ouvre également les cas d'exception. Il est seulement possible si UINT_MAX est beaucoup plus grande que (INT_MIN-INT_MAX), de sorte que vous pouvez mettre votre code d'exception dans un bloc if poser exactement la question, en quelque sorte, et il ne vous ralentira pas sur un système traditionnel.

Je ne suis pas exactement sûr de la façon de construire ces constantes de compilation de traiter correctement avec cette.
- UINT_MAX ne peut pas être petite par rapport à INT_MAX, parce que la spécification garantit que chaque positive signé int est représentable comme un unsigned int. Mais UINT_MAX+1 est de zéro pour chaque système; unsigned l'arithmétique est toujours modulo UINT_MAX+1. Encore il pourrait y avoir un noyau d'une approche pratique ici...
- En suivant ce fil, donc pardon pour mon potentiellement question évidente: Est-ce votre déclaration "UINT_MAX+1 est de zéro pour chaque système de " établis dans la '03-spec? Si oui, est-il une sous-section I devrait être à la recherche de sous? Merci.
- Section 3.9.1 paragraphe 4: "des entiers non signés, déclaré non signé, doit obéir aux lois de l'arithmétique modulo 2^n, où n est le nombre de bits dans la représentation de la valeur de la taille de l'entier", avec une note disant: "Cela implique que non signé de l'arithmétique ne déborde pas, car un résultat qui ne peut pas être représenté par la résultante de type entier non signé est réduite modulo le nombre qui est plus grand que la plus grande valeur qui peut être représentée par la résultante de type entier non signé." Fondamentalement, non signé est spécifié pour fonctionner de la façon dont vous le souhaitez/vous attendre.
- Merci. très apprécié.
InformationsquelleAutor Yakk - Adam Nevraumont

Mon argent est sur l'utilisation de memcpy. Tout bon compilateur sait optimiser loin:

#include <stdio.h>
#include <memory.h>
#include <limits.h>

static inline int unsigned_to_signed(unsigned n)
{
    int result;
    memcpy( &result, &n, sizeof(result));
    return result;
}

int main(int argc, const char * argv[])
{
    unsigned int x = UINT_MAX - 1;
    int xx = unsigned_to_signed(x);
    return xx;
}

Pour moi (Xcode 8.3.2, Apple LLVM 8.1, -O3), qui produit:

_main:                                  ## @main
Lfunc_begin0:
    .loc    1 21 0                  ## /Users/Someone/main.c:21:0
    .cfi_startproc
## BB#0:
    pushq    %rbp
Ltmp0:
    .cfi_def_cfa_offset 16
Ltmp1:
    .cfi_offset %rbp, -16
    movq    %rsp, %rbp
Ltmp2:
    .cfi_def_cfa_register %rbp
    ##DEBUG_VALUE: main:argc <- %EDI
    ##DEBUG_VALUE: main:argv <- %RSI
Ltmp3:
    ##DEBUG_VALUE: main:x <- 2147483646
    ##DEBUG_VALUE: main:xx <- 2147483646
    .loc    1 24 5 prologue_end     ## /Users/Someone/main.c:24:5
    movl    $-2, %eax
    popq    %rbp
    retq
Ltmp4:
Lfunc_end0:
    .cfi_endproc

Cela ne répond pas à la question, que la représentation binaire d'un entier non signé est pas garantie par le standard pour correspondre à la signature de la représentation.

InformationsquelleAutor Someone

std::numeric_limits<int>::is_modulo est une compilation constante de temps. de sorte que vous pouvez l'utiliser pour le modèle de la spécialisation. problème résolu, au moins si compilateur joue avec inline.

#include <limits>
#include <stdexcept>
#include <string>
#ifdef TESTING_SF
bool const testing_sf = true;
#else
bool const testing_sf = false;
#endif
//C++ "extensions"
namespace cppx {
using std::runtime_error;
using std::string;
inline bool hopefully( bool const c ) { return c; }
inline bool throw_x( string const& s ) { throw runtime_error( s ); }
}  //namespace cppx
//C++ "portability perversions"
namespace cppp {
using cppx::hopefully;
using cppx::throw_x;
using std::numeric_limits;
namespace detail {
template< bool isTwosComplement >
int signed_from( unsigned const n )
{
if( n <= unsigned( numeric_limits<int>::max() ) )
{
return static_cast<int>( n );
}
unsigned const u_max = unsigned( -1 );
unsigned const u_half = u_max/2 + 1;
if( n == u_half )
{
throw_x( "signed_from: unsupported value (negative max)" );
}
int const i_quarter = static_cast<int>( u_half/2 );
int const int_n1 = static_cast<int>( n - u_half );
int const int_n2 = int_n1 - i_quarter;
int const int_n3 = int_n2 - i_quarter;
hopefully( n == static_cast<unsigned>( int_n3 ) )
|| throw_x( "signed_from: range error" );
return int_n3;
}
template<>
inline int signed_from<true>( unsigned const n )
{
return static_cast<int>( n );
}
}    //namespace detail
inline int signed_from( unsigned const n )
{
bool const is_modulo = numeric_limits< int >::is_modulo;
return detail::signed_from< is_modulo && !testing_sf >( n );
}
}    //namespace cppp
#include <iostream>
using namespace std;
int main()
{
int const x = cppp::signed_from( -42u );
wcout << x << endl;
}

MODIFIER: correction du code pour éviter les pièges potentiels sur la non-modulaire-int machines (une seule est connue, à savoir la archaically configuré versions de la Unisys Clearpath). Pour plus de simplicité il suffit de ne pas soutenir la valeur -2^n-1, où n est le nombre de int valeur des bits, sur la machine (c'est à dire, sur la Clearpath). dans la pratique, cette valeur ne sera pas pris en charge par la machine, soit (c'est à dire, avec le signe et l'ampleur ou l'1 complément représentation).

InformationsquelleAutor Cheers and hth. - Alf

1

Je pense que le type int est au moins deux octets, de sorte que le INT_MIN et INT_MAX peut changer dans différentes plates-formes.

Types fondamentaux

≤climits≥ - tête

InformationsquelleAutor
-4

Ce qui est parfaitement conforme à la norme, et de compiler pour non-op sur MSVC/gcc.
```
int unsigned_to_signed(unsigned int n)
{
union UltimateCast
{
unsigned int In;
int Out;
} cast;
cast.In = n;
return cast.Out;
}
```
Pour le code appelant comme:
```
volatile unsigned int i = 32167;
int main()
{
return unsigned_to_signed( i );
}
```
Nous aurons cette assemblée de sortie (g++ -O3-S):
```
__Z18unsigned_to_signedj:
movl    4(%esp), %eax
ret
_main:
pushl   %ebp
movl    %esp, %ebp
andl    $-16, %esp
call    ___main
movl    _i, %eax
leave
ret
.globl  _i
.data
.align 4
_i:
.long   32167
```
Et de la déclaration de unsigned_to_signed() comme inline rendements:
```
_main:
pushl   %ebp
movl    %esp, %ebp
andl    $-16, %esp
call    ___main
movl    _i, %eax
leave
ret
.globl  _i
.data
.align 4
_i:
.long   32167
```
Qui est assez propre code.
- Cela rend non-strictement-portable hypothèses: le comportement de lecture cast.Out est pas défini lorsque les bits de cast.In ne représentent pas une valeur de type int. Il fonctionnera dans la pratique, sur presque tous les systèmes, mais ce sera un simple static_cast à int.
- Les alias sont autorisés pour les types qui ne diffèrent que par le qualificatif ou un signe.
- Oui, ce n'est pas potentiellement indéfinie en raison d'un aliasing violation, c'est potentiellement indéfinie en raison de la lecture d'un piège de la représentation.
- Pour le complément à deux de la représentation de chaque et tous les bits de permutation est mappé à un valide signé/non signé valeur.
- Pour complément à deux avec INT_MIN < -INT_MAX et pas de rembourrage bits, vous avez raison. Et ce sera en effet le système le plus commun. J'ai lu la question comme nécessitant un comportement défini pour les rares systèmes de trop, mais si standard comportement défini est nécessaire pour les systèmes communs, votre réponse me semble bon.
- Ok, je vois. En outre, la mise en œuvre n'est pas nécessaire pour détecter un piège de la représentation, de sorte qu'il peut vraiment travailler sur uncommon systèmes. Cependant, cela ressemble à un comportement non défini dans la présente affaire.
- Oui, le but de la question est d'éviter la mise en œuvre défini et indéfini comportement sur n'importe quel standard-système conforme, n'importe comment pervers.
- This is perfectly standard-compliant: Non, la norme ne dites pas que vous obtiendrez le droit de répondre à cette voie.
- Droit de réponse? Pas de. Un comportement non défini - aussi pas.
- Je suis d'accord. Si je comprends la norme de droit, il est légal et sécuritaire de le faire, mais la valeur qui en résulte pourrait être n'importe quoi.
InformationsquelleAutor Sergey K.

Vous devez vous connecter pour publier un commentaire.