Nombre d'Unités de Calcul correspondant au nombre de groupes de travail

J'ai besoin de quelques éclaircissements. Je suis le développement de OpenCL sur mon ordinateur portable exécutant un petit GPU nvidia (310M). Quand j'ai une requête de l'appareil, pour CL_DEVICE_MAX_COMPUTE_UNITS, le résultat est 2. J'ai lu le nombre de groupes de travail pour l'exécution d'un noyau devrait correspondre au nombre d'unités de calcul (Caractère hétérogène de l'Informatique avec OpenCL, Chapitre 9, p. 186), sinon, il serait de perdre trop de mémoire globale bande passante.

Aussi la puce est spécifiée pour avoir 16 cuda cores (qui correspondent à PEs, je crois). Est-ce à dire que, théoriquement, le plus performant de l'installation de ce gpu, concernant la mémoire globale de la bande passante, c'est d'avoir deux groupes de travail avec les 16 éléments de travail de chacun?

OriginalL'auteur rdoubleui | 2012-02-17