CUDA max threads dans un bloc
J'ai une confusion à partir du guide de programmation . Il stipule ce qui suit:
- maxThreadsPerBlock: 512
- maxThreadsDim: 512, 512, 64 .
Lorsque le nombre maximum de threads dans un bloc peut être de 512, comment le max de thread dimension 512*512*64 ?
source d'informationauteur kar
Vous devez vous connecter pour publier un commentaire.
Maximum de threads dans la direction X: 512 (1024 pour calculer la capacité >= 2.0)
Maximum de threads dans la direction Y: 512 (1024 pour calculer la capacité >= 2.0)
Maximum de threads dans la direction Z: 64
De sorte que vous pouvez lancer le bloc suivant les configurations (compute capability >= 2.0 indiqué entre parenthèses)
512 x 1 x 1 (1 024 x 1 x 1)
128 x 2 x 2 (256 x 2 x 2)
1 x 512 x 1 (1 x 1024 x 1)
1 x 8 x 64 (2 x 8 x 64)
2 x 4 x 64 (4 x 4 x 64)
et ainsi de suite.
Le nombre total de threads dans un bloc ne doit pas dépasser 512 (pour calculer la capacité de < 2.0), ou 1024 (pour calculer la capacité >= 2.0).