imprimer un __m128i variable

Je suis en train d'apprendre à coder à l'aide de intrinsèques et ci-dessous est un code qui n'est plus

compiler used: icc

#include<stdio.h>
#include<emmintrin.h>
int main()
{
        __m128i a = _mm_set_epi32(1,2,3,4);
        __m128i b = _mm_set_epi32(1,2,3,4);
        __m128i c;
        c = _mm_add_epi32(a,b);
        printf("%d\n",c[2]);
        return 0;
}

J'obtiens l'erreur ci-dessous:

test.c(9): error: expression must have pointer-to-object type
        printf("%d\n",c[2]);

Comment puis-je imprimer les valeurs de la variable c qui est de type __m128i

Notez également que __m128i n'a aucune info sur le type qui est stockée. Il pourrait être de 8 bits entiers, 16 bits entiers, 32-bit, etc... Certains compilateurs soutenir le .m128i_i32 terrain extensions. Mais ce n'est certainement pas la norme et non pas dans GCC.
lié au titre: comment faire pour imprimer __uint128_t nombre à l'aide de gcc?
Notez que certains compilateurs ont intégré dans les printf de soutien pour SIMD types, par exemple d'Apple versions de gcc, clang, etc, tout le soutien %vld pour l'impression d'un __m128i 4 x 32 bits entiers.
Je suis en utilisant le compilateur intel
Est il possible de le faire masqués de plus. Dire que j'aimerais stocker uniquement l'autre des éléments (c[0],c[2])?

OriginalL'auteur arunmoezhi | 2012-11-06

19

Utilisez cette fonction pour imprimer:
```
void print128_num(__m128i var)
{
    uint16_t *val = (uint16_t*) &var;
    printf("Numerical: %i %i %i %i %i %i %i %i \n", 
           val[0], val[1], val[2], val[3], val[4], val[5], 
           val[6], val[7]);
}
```
Vous split 128bits en 16 bits(ou 32-bits) avant de les imprimer.

C'est une façon de 64 bits du fractionnement et de l'impression si vous avez 64-bit support disponible:
```
void print128_num(__m128i var) 
{
    int64_t *v64val = (int64_t*) &var;
    printf("%.16llx %.16llx\n", v64val[1], v64val[0]);
}
```
Remplacer llx avec lld si tu veux int.
elle fonctionne. J'ai utilisé uint32_t pour imprimer les nombres entiers de 32 bits. Mais la sortie est inversée. Au lieu de 2,4,6,8 - je obtenir 8,6,4,2. Ne _mm_add_epi32 stocker les valeurs dans l'ordre inverse?
Avez-vous lu Endian-ness?
Est ce pointeur aliasing juridique?
Probablement pas. Un _mm_extract_epi32, ou à une banque locale tableau sont de plus normal. Vous pouvez également affecter un union d'un __m128i et un tableau. C'est très bien pour le test / debug-imprime si il arrive à travailler lorsque vous essayez-le. Un débogueur va vous montrer ce qui est dans votre vecteurs plus facilement que debug-estampes, cependant.

OriginalL'auteur
9
- Portable à travers gcc/clang/CPI/MSVC, le C et le C++.
- totalement en sécurité avec tous les niveaux d'optimisation: pas de pointeur aliasing (contrairement à la plupart des autres réponses)
- impression en hexadécimal comme u8 u16, u32, ou u64 éléments (@AG1 réponse)
- Imprime dans la mémoire de commande (moins-élément important de la première, comme _mm_setr_epiX). Inverser les indices de tableau, si vous préférez impression dans le même ordre d'Intel manuels d'utilisation, où l'élément le plus significatif est sur la gauche (comme _mm_set_epiX). Connexes: Convention pour l'affichage des registres vectoriels
À l'aide d'un __m128i* à charger à partir d'un tableau de int est sûr parce que la __m128 types sont définis pour permettre le repliement. (par exemple, dans le ccag-têtes, la définition inclut les __attribute__((may_alias)).)

L'inverse n'est pas coffre-fort (une __m128i objet et un int pointeur). Il peut arriver de travailler dans la plupart des cas, mais pourquoi prendre le risque?

(uint32_t*) &my_vector viole le C et le C++ aliasing règles, et n'est pas garanti pour fonctionner de la façon que vous attendez. Le stockage à un tableau et ensuite l'accès, il est garanti d'être en sécurité. Même optimise loin avec la plupart des compilateurs, de sorte que vous obtenez movq /pextrq directement à partir de xmm entier registres au lieu d'une réelle magasin/recharger, par exemple.

Source + asm sortie sur le Godbolt compilateur explorer: la preuve il compile avec MSVC et ainsi de suite.
```
#include <immintrin.h>
#include <stdint.h>
#include <stdio.h>

#ifndef __cplusplus
#include <stdalign.h>   //C11 defines _Alignas().  This header defines alignas()
#endif

void p128_hex_u8(__m128i in) {
    alignas(16) uint8_t v[16];
    _mm_store_si128((__m128i*)v, in);
    printf("v16_u8: %x %x %x %x | %x %x %x %x | %x %x %x %x | %x %x %x %x\n",
           v[0], v[1],  v[2],  v[3],  v[4],  v[5],  v[6],  v[7],
           v[8], v[9], v[10], v[11], v[12], v[13], v[14], v[15]);
}

void p128_hex_u16(__m128i in) {
    alignas(16) uint16_t v[8];
    _mm_store_si128((__m128i*)v, in);
    printf("v8_u16: %x %x %x %x,  %x %x %x %x\n", v[0], v[1], v[2], v[3], v[4], v[5], v[6], v[7]);
}

void p128_hex_u32(__m128i in) {
    alignas(16) uint32_t v[4];
    _mm_store_si128((__m128i*)v, in);
    printf("v4_u32: %x %x %x %x\n", v[0], v[1], v[2], v[3]);
}

void p128_hex_u64(__m128i in) {
    alignas(16) unsigned long long v[2];  //uint64_t might give format-string warnings with %llx; it's just long in some ABIs
    _mm_store_si128((__m128i*)v, in);
    printf("v2_u64: %llx %llx\n", v[0], v[1]);
}
```
Si vous avez besoin de portabilité de C99 ou C++03 ou plus tôt (c'est à dire sans C11 /C++11), retirez la alignas() et l'utilisation storeu au lieu de store. Ou utiliser __attribute__((aligned(16))) ou __declspec( align(16) ) à la place.

(Si vous écrivez du code avec intrinsèques, vous devriez être en utilisant une récente version de compilateur. Nouveaux compilateurs font généralement mieux asm que les anciens compilateurs, y compris pour les SSE/AVX intrinsèques. Mais peut-être que vous voulez utiliser gcc-6.3 avec -std=gnu++03 C++03 mode pour une base de code qui n'est pas prêt pour le C++11 ou quelque chose.)

Exemple de sortie de l'appel de tous les 4 fonctions sur
```
//source used:
__m128i vec = _mm_setr_epi8(1, 2, 3, 4, 5, 6, 7,
                            8, 9, 10, 11, 12, 13, 14, 15, 16);

//output:

v2_u64: 0x807060504030201 0x100f0e0d0c0b0a09
v4_u32: 0x4030201 0x8070605 0xc0b0a09 0x100f0e0d
v8_u16: 0x201 0x403 0x605 0x807  | 0xa09 0xc0b 0xe0d 0x100f
v16_u8: 0x1 0x2 0x3 0x4 | 0x5 0x6 0x7 0x8 | 0x9 0xa 0xb 0xc | 0xd 0xe 0xf 0x10
```
Ajuster le format des chaînes si vous voulez pad avec les zéros non significatifs pour la cohérence des résultats de la largeur. Voir printf(3).

OriginalL'auteur
4

Je sais que cette question est marqué C, mais c'était le meilleur résultat de la recherche aussi lors de la recherche du C++ solution au même problème.

Donc, cela pourrait être une implémentation C++:
```
#include <string>
#include <cstring>
#include <sstream>

#if defined(__SSE2__)
template <typename T>
std::string __m128i_toString(const __m128i var) {
    std::stringstream sstr;
    T values[16/sizeof(T)];
    std::memcpy(values,&var,sizeof(values)); //See discussion below
    if (sizeof(T) == 1) {
        for (unsigned int i = 0; i < sizeof(__m128i); i++) { //C++11: Range for also possible
            sstr << (int) values[i] << " ";
        }
    } else {
        for (unsigned int i = 0; i < sizeof(__m128i) / sizeof(T); i++) { //C++11: Range for also possible
            sstr << values[i] << " ";
        }
    }
    return sstr.str();
}
#endif
```
Utilisation:
```
#include <iostream>
[..]
__m128i x
[..]
std::cout << __m128i_toString<uint8_t>(x) << std::endl;
std::cout << __m128i_toString<uint16_t>(x) << std::endl;
std::cout << __m128i_toString<uint32_t>(x) << std::endl;
std::cout << __m128i_toString<uint64_t>(x) << std::endl;
```
Résultat:
```
141 114 0 0 0 0 0 0 151 104 0 0 0 0 0 0
29325 0 0 0 26775 0 0 0
29325 0 26775 0
29325 26775
```
Remarque: il existe un moyen simple pour éviter les if (size(T)==1), voir https://stackoverflow.com/a/28414758/2436175

Vous devez utiliser alignas(16) T values[16/sizeof(T)]; et _mm_storeu_si128( (__m128i*)values, var); Tout le reste du code qui fonctionne très bien ensuite. Et simplifie, car vous pouvez utiliser une fourchette comme for(T v : values), je pense.
Je vois votre point de vue. Je me demande si on pourrait simplement utiliser un memcpy au lieu de cela, que serait épargner la nécessité d'avoir une alignée de la mémoire tampon.
Voir ma réponse. Utilisation storeu au lieu de store si vous n'avez pas de C++11 pour alignas, ou le compilateur directives spécifiques. Il sera probablement encore optimiser loin. (Et BTW, moderne Windows / Linux déjà alignez la pile par 16B, de sorte qu'il ne coûte pas le compilateur rien à aligner le tampon, s'il ne fait stocker/reload.)
Pourtant, n'est-ce pas memcpy une alternative valable?
Ouais, c'est seulement un problème de performances si vous ne l'utilisez avec un pas une puissance de 2 classe, pas uint*_t. Il est logique de le maintenir comme tel pour des raisons de lisibilité. (Surtout depuis qu'il n'y a rien à hautes performances sur l'utilisation de std::string et une chaîne de stream pour imprimer un vecteur.) Si vous avez été de mettre cela dans une bibliothèque pour les personnes à utiliser sans le regarder, au lieu d'une SORTE de réponse, vous auriez du faire des choix différents.

OriginalL'auteur

#include<stdio.h>
#include<emmintrin.h>
int main()
{
    __m128i a = _mm_set_epi32(1,2,3,4);
    __m128i b = _mm_set_epi32(1,2,3,4);
    __m128i c;

    const int32_t* q; 
    //add a pointer 
    c = _mm_add_epi32(a,b);

    q = (const int32_t*) &c;
    printf("%d\n",q[2]);
    //printf("%d\n",c[2]);
    return 0;
}

Essayer ce code.

Ce code alias pointeurs. Vous êtes sûr que c'est légal?
Je suis sûr que c'est pas strictement juridique (sauf si vous utilisez -fno-strict-aliasing ou quelque chose). J'ai posté une réponse qui est sûr.

OriginalL'auteur

Vous devez vous connecter pour publier un commentaire.