Quelle est la valeur maximale du nombre de bloc possible dans CUDA?

Théoriquement, vous pouvez avoir 65535 blocs par diamension de la grille, jusqu'à 65535 * 65535 * 65535.

Ma question est: Si vous appelez d'un noyau, comme ce kernel<<< BLOCKS,THREADS >>>() (sans dim3 objets), quel est le nombre maximal disponible pour les BLOCS ?

Dans une application de la mienne, je l'ai mis à 192000 et semblait aller bien... Le problème est que le noyau que j'ai utilisé en modifie le contenu d'un tableau énorme, si bien que j'ai vérifié certaines parties du tableau et semble très bien, je ne peux pas être sûr que le noyau se comportait étrangement à d'autres parties.

Pour l'enregistrement j'ai un 2.1 GPU GTX 500 ti.

OriginalL'auteur STE | 2012-03-23