La façon la plus rapide pour la fixation d'un réel (fixe et virgule flottante) de la valeur?

Est-il un moyen plus efficace pour la fixation de nombres réels que l'aide si les déclarations ou ternaire opérateurs?
Je veux le faire à la fois pour les doubles et un 32 bits fixpoint de mise en œuvre (16.16). Je suis pas demander de code qui peut gérer les deux cas, ils seront traités dans des fonctions séparées.

Évidemment, je peux faire quelque chose comme:

double clampedA;
double a = calculate();
clampedA = a > MY_MAX ? MY_MAX : a;
clampedA = a < MY_MIN ? MY_MIN : a;

double a = calculate();
double clampedA = a;
if(clampedA > MY_MAX)
    clampedA = MY_MAX;
else if(clampedA < MY_MIN)
    clampedA = MY_MIN;

La fixpoint version utiliser les fonctions/macros pour les comparaisons.

Cela est fait dans un critiques des performances de la partie du code, donc je suis à la recherche d'un moyen efficace de le faire que possible (ce qui je pense serait d'impliquer la manipulation de bits)

EDIT: Il doit être standard/C portable, une plate-forme spécifique fonctionnalité n'est d'aucun intérêt ici. Aussi, MY_MIN et MY_MAX sont du même type que la valeur que je veux serré (doubles dans les exemples ci-dessus).

Je pense que vous pouvez utiliser SSE3 ou une technologie semblable pour cela, mais ne savez pas exactement quelles commandes/comment... Vous pouvez prendre un coup d'oeil sur: Saturation de l'arithmétique
Désolé, la question n'était pas claire au sujet de la plate-forme d'exigences. J'ai édité la question d'être un peu effacé.
Je sais qu'il a été deux ans et demi, depuis que vous avez posé cette question, mais j'espère que vous vérifier ma réponse - 3x amélioration est significative.
Un détail n'est pas spécifié est ce que la précision (relative ou absolue) êtes-vous prêt à échanger pour la vitesse si tout. Si le code exige une gamme a être retourné exactement comme a, puis beaucoup de réponses ne répondent pas à cet obstacle. Si la précision est d'aucun intérêt , puis revenant toujours (MY_MAX + MY_MIN)/2 sera certainement un rapide à faible précision de la réponse, et certainement stupide. Recommander à tolérer pas plus que 1 ULP d'erreur.
Comment voulez-vous faire sur SSE4 variable (__m128)?
connexes plus-efficace-élégant-moyen-pour-clip-un-nombre

InformationsquelleAutor Niklas | 2009-01-09

bit-manipulation c clamp numbers

8

Pour la 16.16 représentation, le simple ternaire est peu susceptible d'être amélioré en termes de vitesse.

Et pour les doubles, parce que vous en avez besoin standard/C portable, peu-manipulation de tout type finira mal.

Même si un peu de violon était possible (ce dont je doute), vous pourriez être en s'appuyant sur la représentation binaire de doubles. CE (et leur taille) EST DÉPENDANT de l'IMPLÉMENTATION.

Vous pourriez "deviner" ce en utilisant sizeof(double), puis en comparant la mise en page de divers double des valeurs à leurs représentations binaires, mais je pense que vous êtes sur une cachette pour rien.

La meilleure règle est de DIRE AU COMPILATEUR CE que VOUS VOULEZ (c'est à dire ternaire), et il l'optimiser pour vous.

EDIT: tarte Humble temps. Je viens de tester quinmars idée (ci-dessous), et il fonctionne - si vous avez IEEE-754 flotteurs. Cela a donné un gain d'environ 20% sur le code ci-dessous. IObviously non-portable, mais je pense qu'il y a peut-être une façon standardisée de demander à votre compilateur, s'il utilise des float IEEE754 formats avec un #IF...?
```
  double FMIN = 3.13;
  double FMAX = 300.44;

  double FVAL[10] = { -100, 0.23, 1.24, 3.00, 3.5, 30.5, 50 ,100.22 ,200.22, 30000};
  uint64  Lfmin = *(uint64 *)&FMIN;
  uint64  Lfmax = *(uint64 *)&FMAX;

    DWORD start = GetTickCount();

    for (int j=0; j<10000000; ++j)
    {
        uint64 * pfvalue = (uint64 *)&FVAL[0];
        for (int i=0; i<10; ++i)
            *pfvalue++ = (*pfvalue < Lfmin) ? Lfmin : (*pfvalue > Lfmax) ? Lfmax : *pfvalue;
    }

    volatile DWORD hacktime = GetTickCount() - start;

    for (int j=0; j<10000000; ++j)
    {
        double * pfvalue = &FVAL[0];
        for (int i=0; i<10; ++i)
            *pfvalue++ = (*pfvalue < FMIN) ? FMIN : (*pfvalue > FMAX) ? FMAX : *pfvalue;
    }

    volatile DWORD normaltime = GetTickCount() - (start + hacktime);
```
- En supposant que la norme IEEE-754 pour la virgule flottante est suffisamment portable pour ma situation. Merci de prendre le temps de faire un suivi.
- La version avec int64_t donnera de mauvais résultats lorsque les deux FMIN et *pfvalue sont inférieurs à zéro, par exemple, FMIN=-1, FMAX=1, (*pfvalue)=-0.1; voir ma réponse stackoverflow.com/questions/427477/...
- Ah oui. IEE754 utilise le signe et l'ampleur de l'encodage, pas 2s compléter. Les comparaisons avec les nombres négatifs sont défectueux. Si FMIN et FMAX à la fois >= zéro, alors vous êtes beaux (même si pfvalue est négatif). Si FMAX FMIN ou sont à zéro, tous les paris sont éteints...
- Je me demande si vous auriez le temps de comparer ma branche sans min/max de la solution contre le vôtre? J'aimerais quelques validation indépendante, surtout depuis que je n'étais pas en mesure de dupliquer vos résultats avec quinmars version.
- Je vais voir ce que je peux faire. Les différents résultats sont probablement parce que votre compilateur juste optimisé une charge mieux que la mienne!
InformationsquelleAutor Roddy
37

Vieille question, mais j'ai été de travailler sur ce problème aujourd'hui (avec des doubles/flotteurs).

La meilleure approche est d'utiliser de l'ESS MINSS/MAXSS pour des flotteurs et SSE2 MINSD/MAXSD pour les doubles. Ce sont dépourvu de branches et de prendre un seul cycle d'horloge chaque, et sont faciles à utiliser grâce à compilateur intrinsèques. Ils confèrent à plus d'un ordre de grandeur de l'augmentation des performances par rapport à serrage avec std::min/max.

Vous pouvez trouver que surprenant. Je n'ai certainement! Malheureusement VC++ 2010 utilise des comparaisons simples pour std::min/max, même lorsque /arch:SSE2 et /FP:rapide sont activés. Je ne peux pas parler pour les autres compilateurs.

Voici le code nécessaire pour ce faire, dans VC++:
```
#include <mmintrin.h>

float minss ( float a, float b )
{
    //Branchless SSE min.
    _mm_store_ss( &a, _mm_min_ss(_mm_set_ss(a),_mm_set_ss(b)) );
    return a;
}

float maxss ( float a, float b )
{
    //Branchless SSE max.
    _mm_store_ss( &a, _mm_max_ss(_mm_set_ss(a),_mm_set_ss(b)) );
    return a;
}

float clamp ( float val, float minval, float maxval )
{
    //Branchless SSE clamp.
    //return minss( maxss(val,minval), maxval );

    _mm_store_ss( &val, _mm_min_ss( _mm_max_ss(_mm_set_ss(val),_mm_set_ss(minval)), _mm_set_ss(maxval) ) );
    return val;
}
```
La double précision, le code est le même, sauf avec xxx_sd à la place.

Edit: j'ai d'Abord écrit la pince fonction commenté. Mais en regardant l'assembleur de sortie, j'ai remarqué que le compilateur VC++ n'était pas assez intelligent pour choisir la redondant déplacer. Un de moins instruction. 🙂
- Est-il un équivalent pour ces fonctions pour GCC?
- Oui, pour GCC x86 utilisation __builtin_ia32_storess, __builtin_ia32_maxss, __builtin_ia32_minss " sont l'équivalent des fonctions et de la xmmintrin.h - tête pour SSE1 instructions. Passer -mmmx -msse pour le compilateur, vous pouvez avoir besoin -mfpmath=sse(,x87) ainsi. Intrinsèques sont également disponibles pour ARM Neon et AltiVec. Voir X86 fonctions intégrées pour plus de détails.
- Il n'est pas possible pour le compilateur de remplacer std::min et std::max avec le intrinsèques dans le cas général, parce que la intrinsèques fournir les IEEE754 résultat déterminé pour min(2.0, NaN) et min(NaN, 2.0) (qui est 2.0 dans les deux cas), tandis qu'un naïf mise en œuvre, basé sur une simple comparaison sera de retour à un résultat incohérent en fonction du paramètre d'ordre. C99 et C++11 fournir fmax et fmin, et un habile compilateur remplace avec efficacité inline implémentations.
- Est-il une commutation de peine pour l'utilisation des instructions SSE, ou entrelacement avec la norme virgule flottante ops?
- Cela semble vraiment utile --- personne ne sait d'une mise en œuvre complète n'importe où, par exemple, avec une bonne #ifdef pour gcc et clang etc.?
InformationsquelleAutor Spat
36

GCC et clang générer beau montage pour la suivante, simple, simple, portable code:
```
double clamp(double d, double min, double max) {
  const double t = d < min ? min : d;
  return t > max ? max : t;
}
```
> gcc -O3 -march=native -Wall -Wextra -Wc++-compat -S -fverbose-asm clamp_ternary_operator.c

GCC-assembly généré:
```
maxsd   %xmm0, %xmm1    # d, min
movapd  %xmm2, %xmm0    # max, max
minsd   %xmm1, %xmm0    # min, max
ret
```
> clang -O3 -march=native -Wall -Wextra -Wc++-compat -S -fverbose-asm clamp_ternary_operator.c

Bruit généré par l'assemblée:
```
maxsd   %xmm0, %xmm1
minsd   %xmm1, %xmm2
movaps  %xmm2, %xmm0
ret
```
Trois instructions (sans compter le ret), pas de branches. Excellent.

Cela a été testé avec GCC 4.7 et clang 3.2 sur Ubuntu 13.04 avec un Core i3 M 350.
Sur une note côté, le simple code C++ appel std::min et std::max généré de la même assemblée.

C'est pour les doubles. Et pour les int, GCC et clang générer de l'assemblée avec cinq instructions (sans compter le ret) et pas de branches. Aussi excellent.

Je ne suis pas actuellement l'utilisation de la virgule fixe, donc je ne vais pas donner un avis sur un point fixe.
- Grand. Légèrement mieux que répondre comme il symétriquement poignées min et/ou max quand un ou les deux ne sont Pas Un nombre. Il a également préserver signe avec d = -0.0!
- À l'aide de if (d < min) et if (d > max) me donne aussi le même code assembleur. Il est intéressant de constater, cependant, que l'utilisation de if (d < min) et else if (d > max) génère une sortie différente (il y a une instruction de saut).
- Exact. Cela devrait être la bonne réponse. C'est un compilateur analyse de la question: godbolt.org/z/ZW4W6F
InformationsquelleAutor Jorge
15

Si votre processeur a une rapide instruction pour valeur absolue (comme le x86 n'), vous pouvez faire un sans branches min et max qui sera plus rapide qu'un if déclaration ou ternaire de l'opération.
```
min(a,b) = (a + b - abs(a-b)) / 2
max(a,b) = (a + b + abs(a-b)) / 2
```
Si l'un des termes est égale à zéro (comme c'est souvent le cas lorsque vous êtes de serrage) le code simplifie un peu plus loin:
```
max(a,0) = (a + abs(a)) / 2
```
Lorsque vous êtes en combinant les deux opérations que vous pouvez remplacer les deux /2 en un seul /4 ou *0.25 pour enregistrer une étape.

Le code suivant est plus de 3x plus rapide que le ternaire sur mon Athlon II X2, lors de l'utilisation de l'optimisation pour FMIN=0.
```
double clamp(double value)
{
    double temp = value + FMAX - abs(value-FMAX);
#if FMIN == 0
    return (temp + abs(temp)) * 0.25;
#else
    return (temp + (2.0*FMIN) + abs(temp-(2.0*FMIN))) * 0.25;
#endif
}
```
- Wow - belle idée! Je soupçonne que sur certains Processeurs/compilateurs cela pourrait en fait être plus lent que le ternaire si abs(a) n'est pas inline/optimisé bien...
- En C#, on utilise les Mathématiques.Abs, cette approche est plus lent.
- Aussi SIMD compatible
- Je m'attends à ce fabs(value-FMAX) plutôt que int abs(int j).
- J'ai testé avec un compilateur C++ qui pourrait avoir utilisé le bon fonctionnement par une surcharge.
- Faiblesse: Cette approche peut encourir servir perte de précision. FMAX des valeurs supérieures à value peut perdre de la précision dans le résultat. Si FMAX est 10x value, puis 1 décimale peut être perdu. Pire des cas, serrées valeur de retour est toujours 0.0.
- Auriez-vous besoin de dire min(a,b) = (a + b - abs(static_cast<int>(a-b))) / 2 pour des valeurs non signées? Sans le static_cast<int>, a-b pourrait être d'une très grande valeur si b > a, qui serait à son tour donner une valeur incorrecte.
InformationsquelleAutor Mark Ransom
14

Opérateur ternaire est vraiment la voie à suivre, parce que la plupart des compilateurs sont capables de les compiler en natif le fonctionnement matériel qui utilise un conditionnel déplacer au lieu d'une branche (et évite donc le mispredict peine et du pipeline de bulles et ainsi de suite). De manipulation de bits est susceptible de causer une charge-hit-magasin.

En particulier, PPC et x86 avec SSE2 matériel op qui pourrait être exprimée comme une valeur intrinsèque de quelque chose comme ceci:
```
double fsel( double a, double b, double c ) {
  return a >= 0 ? b : c; 
}
```
L'avantage est qu'il n'est présent à l'intérieur de la canalisation, sans provoquer une branche. En fait, si votre compilateur utilise la valeur intrinsèque, vous pouvez l'utiliser pour mettre en œuvre votre pince directement:
```
inline double clamp ( double a, double min, double max ) 
{
   a = fsel( a - min , a, min );
   return fsel( a - max, max, a );
}
```
Je vous suggère fortement de éviter de manipulation de bits en double en utilisant les opérations sur entiers. Sur la plupart des Processeurs modernes il n'y a aucun moyen direct de déplacement de données entre le double et int registres autres que de prendre un aller-retour à la dcache. Ce sera la cause d'une des données de danger appelé une charge-hit-store qui, en gros, vide le PROCESSEUR pipeline jusqu'à ce que la mémoire d'écriture est terminée (généralement autour de 40 cycles ou plus).

La seule exception est si le double des valeurs sont déjà en mémoire et non pas dans un registre: dans ce cas, il n'y a aucun danger d'une charge-hit-store. Toutefois, votre exemple indique que vous avez juste calculé le double et l'a retourné à partir d'une fonction qui signifie qu'il est probablement encore en XMM1.
- une remarque à propos de l'opérateur ternaire: Tester la façon dont le type et l'ordre des entrées affecte la sortie optimisé. J'ai travaillé sur un compilateur où A > B ? A : B toujours généré un MAX d'instruction, mais A < B ? B : A n'a pas.
- Tu dois me demande ce qu'il a dans l'esprit de la personne qui a écrit ce compilateur.
- Fonctionne très bien, tous les FP numéros! Il a même conservé le signe avec a == -0.0! Seules les valeurs/les limites, j'ai eu quelques souci impliqué une certaine asymétrie avec Pas-un-nombre - Permet min être un Pas-un-nombre et joliment ignore la min. Pourtant, si max est NAN, le résultat est NAN. Pourrait être fait symétrique avec un code différent de return fsel( a - max, max, a );
InformationsquelleAutor Crashworks
7

Les bits de la norme IEEE 754 à virgule flottante sont agencés de telle sorte que si l'on compare les bits interprété comme un entier, vous obtenez les mêmes résultats que si vous ne comparer que des flotteurs directement. Donc, si vous trouvez ou connaissez un moyen de serrage entiers que vous pouvez l'utiliser pour (IEEE 754) flotte ainsi. Désolé, je ne connais pas un moyen plus rapide.

Si vous avez les chars stockées dans un des tableaux, vous pouvez envisager d'utiliser certaines extensions de CPU comme SSE3, comme rkj dit. Vous pouvez prendre un coup d'oeil à liboil il fait tout le sale boulot pour vous. Maintient votre programme portable et utilise plus rapide cpu instructions si possible. (Je ne suis pas sûr tho comment OS/compilateur indépendant liboil est).
- Seulement positive de la flotte. Si les signes peuvent être mélangés, vous avez besoin de les noter, de retour plus tôt si différent, l'absolu des valeurs et de l'inverse de la commande si le résultat est négatif. En bref, l'optimisation ne fonctionne que pour les positifs des flotteurs.
InformationsquelleAutor quinmars
7

Plutôt que de tester et de branchement, j'ai l'habitude d'utiliser ce format pour le serrage:
```
clampedA = fmin(fmax(a,MY_MIN),MY_MAX);
```
Bien que je n'ai jamais fait aucune analyse de la performance sur le code compilé.
- Nice. Tout code alternatif devrait être testé à l'encontre de ce que la norme à battre en performance, mais correspondre à la fonctionnalité.
InformationsquelleAutor Linasses
4

De façon réaliste, aucun décent compilateur fera la différence entre un if() et d'un état ?: de l'expression. Le code est assez simple, qu'ils vont être en mesure de repérer les chemins possibles. Cela dit, vos deux exemples ne sont pas identiques. L'équivalent du code à l'aide ?: serait
```
a = (a > MAX) ? MAX : ((a < MIN) ? MIN : a);
```
comme éviter que l'Un < MIN de test lors de l'a > MAX. Maintenant que pourrait faire une différence, que le compilateur, autrement, aurait pour tache de la relation entre les deux tests.

Si le serrage est rare, vous pouvez tester la nécessité de serrage, avec un seul test:
```
if (abs(a - (MAX+MIN)/2) > ((MAX-MIN)/2)) ...
```
E. g. avec MIN=6 et MAX=10, ce sera la première équipe à une baisse de 8, puis de vérifier si elle se situe entre -2 et +2. Si cela permet d'économiser tout dépend beaucoup du coût relatif de la ramification.
- Vous seriez surpris de voir -- la dernière fois que j'ai regardé son démontage, mon compilateur, bien cuisinés, un ternaire expression appropriée dans le conditionnel déplacer opcode, mais s'est avéré un équivalent si/d'autre bloc en deux et compare les branches.
- J'ai aimé l'idée de la pince avec un seul test 😉
- Je cherchais un moyen rapide de tester si un point est à l'intérieur d'une boîte englobante. Ce moyen de tester si une valeur X est compris entre max et min, et de même pour une valeur de Y. Votre suggestion a l'air prometteur.
- 1) Attendre fabs() que int abs(int) 2) de Bord de la condition des problèmes avec la perte de précision due à fabs(a - (MAX+MIN)/2) > ((MAX-MIN)/2). La première méthode n'a pas ces problèmes.
InformationsquelleAutor MSalters

Ici est peut-être plus rapidement la mise en œuvre similaire à @Roddy réponse:

typedef int64_t i_t;
typedef double  f_t;

static inline
i_t i_tmin(i_t x, i_t y) {
  return (y + ((x - y) & -(x < y))); //min(x, y)
}

static inline
i_t i_tmax(i_t x, i_t y) {
  return (x - ((x - y) & -(x < y))); //max(x, y)
}

f_t clip_f_t(f_t f, f_t fmin, f_t fmax)
{
#ifndef TERNARY
  assert(sizeof(i_t) == sizeof(f_t));
  //assert(not (fmin < 0 and (f < 0 or is_negative_zero(f))));
  //XXX assume IEEE-754 compliant system (lexicographically ordered floats)
  //XXX break strict-aliasing rules
  const i_t imin = *(i_t*)&fmin;
  const i_t imax = *(i_t*)&fmax;
  const i_t i    = *(i_t*)&f;
  const i_t iclipped = i_tmin(imax, i_tmax(i, imin));

#ifndef INT_TERNARY
  return *(f_t *)&iclipped;
#else /* INT_TERNARY */
  return i < imin ? fmin : (i > imax ? fmax : f); 
#endif /* INT_TERNARY */

#else /* TERNARY */
  return fmin > f ? fmin : (fmax < f ? fmax : f);
#endif /* TERNARY */
}

Voir Calculer le minimum (min) et maximum (max) de deux entiers sans ramification et La comparaison des nombres à virgule flottante

L'IEEE float et double de supports de
conçu de sorte que les nombres sont
“lexicographiquement ordonné”, qui –
dans les mots de l'architecte William IEEE
Kahan signifie “si deux virgule flottante
les numéros dans le même format sont commandés
( par exemple x < y ), alors qu'ils sont commandés
de la même manière lors de leurs morceaux sont
réinterprété comme Signe de Magnitude
les nombres entiers.”

Un programme de test:

/** gcc -std=c99 -fno-strict-aliasing -O2 -lm -Wall *.c -o clip_double && clip_double */
#include <assert.h> 
#include <iso646.h>  //not, and
#include <math.h>    //isnan()
#include <stdbool.h> //bool
#include <stdint.h>  //int64_t
#include <stdio.h>
static 
bool is_negative_zero(f_t x) 
{
return x == 0 and 1/x < 0;
}
static inline 
f_t range(f_t low, f_t f, f_t hi) 
{
return fmax(low, fmin(f, hi));
}
static const f_t END = 0./0.;
#define TOSTR(f, fmin, fmax, ff) ((f) == (fmin) ? "min" :       \
((f) == (fmax) ? "max" :      \
(is_negative_zero(ff) ? "-0.":   \
((f) == (ff) ? "f" : #f))))
static int test(f_t p[], f_t fmin, f_t fmax, f_t (*fun)(f_t, f_t, f_t)) 
{
assert(isnan(END));
int failed_count = 0;
for ( ; ; ++p) {
const f_t clipped  = fun(*p, fmin, fmax), expected = range(fmin, *p, fmax);
if(clipped != expected and not (isnan(clipped) and isnan(expected))) {
failed_count++;
fprintf(stderr, "error: got: %s, expected: %s\t(min=%g, max=%g, f=%g)\n", 
TOSTR(clipped,  fmin, fmax, *p), 
TOSTR(expected, fmin, fmax, *p), fmin, fmax, *p);
}
if (isnan(*p))
break;
}
return failed_count;
}  
int main(void)
{
int failed_count = 0;
f_t arr[] = { -0., -1./0., 0., 1./0., 1., -1., 2, 
2.1, -2.1, -0.1, END};
f_t minmax[][2] = { -1, 1,  //min, max
0, 2, };
for (int i = 0; i < (sizeof(minmax) / sizeof(*minmax)); ++i) 
failed_count += test(arr, minmax[i][0], minmax[i][1], clip_f_t);      
return failed_count & 0xFF;
}

Dans la console:

$ gcc -std=c99 -fno-strict-aliasing -O2 -lm *.c -o clip_double && ./clip_double

Il imprime:

error: got: min, expected: -0.  (min=-1, max=1, f=0)
error: got: f, expected: min    (min=-1, max=1, f=-1.#INF)
error: got: f, expected: min    (min=-1, max=1, f=-2.1)
error: got: min, expected: f    (min=-1, max=1, f=-0.1)

+1 pour l'utilisation de la norme ISO 646 mots-clés. Nous sommes l'une des rares races ...
Re: is_negative_zero, Est-il une raison pourquoi vous n'avez pas l'utilisation du C99 mathématiques.h signbit fonction (combiné avec x == 0), et plutôt utilisé 1.0 / x < 0 pour vérifier le signe de zéro?
ne me souviens pas. signbit semble aussi travail.

InformationsquelleAutor jfs

1

J'ai essayé de l'ESS approche à moi-même, et l'assemblée de sortie de l'air un peu plus propre, j'ai donc été encouragés au premier abord, mais après le calendrier des milliers de fois, c'était en fait un peu plus lent. Il semble en effet comme le VC++ compilateur n'est pas assez intelligent pour savoir ce que vous êtes vraiment l'intention, et il semble faire bouger les choses avant en arrière entre les registres XMM et de la mémoire quand il ne devrait pas. Cela dit, je ne sais pas pourquoi le compilateur n'est pas assez intelligent pour utiliser l'ESS min/max des instructions sur l'opérateur ternaire quand il semble utiliser les instructions SSE pour tous les calculs en virgule flottante de toute façon. D'autre part, si vous êtes à la compilation pour processeurs PowerPC, vous pouvez utiliser le fsel intrinsèque sur le FP registres, et c'est beaucoup plus rapide.

InformationsquelleAutor Corey
0

Si je comprends bien, vous voulez limiter la valeur de "a" à une fourchette entre MY_MIN et MY_MAX. Le type de "a" est un double. Vous n'avez pas spécifié le type de MY_MIN ou MY_MAX.

La simple expression:
```
clampedA = (a > MY_MAX)? MY_MAX : (a < MY_MIN)? MY_MIN : a;
```
devrait faire l'affaire.

Je pense qu'il y a peut-être une petite optimisation si MY_MAX et MY_MIN arriver à être des entiers:
```
int b = (int)a;
clampedA = (b > MY_MAX)? (double)MY_MAX : (b < MY_MIN)? (double)MY_MIN : a;
```
En changeant entier comparaisons, il est possible que vous pourriez obtenir un léger avantage en termes de vitesse.
- J'ai édité la question de l'état les types de ces constantes...
- Même avec MY_MIN,MY_MAX comme int, cette approche ne tient pas si a n'est pas près de la int gamme (int)a est un problème.
InformationsquelleAutor abelenky
0

Si vous souhaitez utiliser rapide, en valeur absolue, des instructions, consultez cette aide de l'extrait de code que j'ai trouvé dans mini ordinateur, qui coince un flotteur à l'intervalle [0,1]
```
clamped = 0.5*(fabs(x)-fabs(x-1.0f) + 1.0f);
```
(J'ai simplifié un peu le code). On peut penser que la prise de deux valeurs, qui se reflète à >0
```
fabs(x)
```
et l'autre réfléchi à 1.0 pour être <1.0
```
1.0-fabs(x-1.0)
```
Et nous prenons la moyenne d'entre eux. Si elle est à portée, puis les deux valeurs seront les mêmes que x, de sorte que leur moyenne sera de nouveau x. Si elle est hors de portée, alors l'une des valeurs de x, et l'autre sera x retournée sur le dos de la "frontière" du point, de sorte que leur moyenne sera précisément le point de démarcation.
- Beaucoup de la perte de précision due, en commençant avec environ x < 0.25. Avec values < DBL__EPSILON, résultat perd toute précision.
InformationsquelleAutor Jeremy Salwen
0

Comme l'a souligné ci-dessus, fmin/fmax fonctions fonctionnent bien (dans gcc, avec -ffast-math). Bien que gfortran a des modèles à utiliser IA instructions correspondant à max/min, g++ ne prend pas. Dans la cpi on doit utiliser au lieu de std::min/max, parce que la cpi n'autorise pas à court de la coupe de la spécification de la façon dont fmin/fmax travailler avec des non-finis opérandes.

InformationsquelleAutor tim18
0

Mes 2 cents en C++. Probablement pas différent que d'utiliser les opérateurs ternaires et, espérons-le pas de ramification code est généré
```
template <typename T>
inline T clamp(T val, T lo, T hi) {
return std::max(lo, std::min(hi, val));
}
```
InformationsquelleAutor wcochran

Vous devez vous connecter pour publier un commentaire.