CUDA Bloc et de la taille de la Grille de l'efficience

Qu'est-ce que le conseillé manière de gérer dynamiquement la taille d'ensembles de données dans cuda?

Est-il d'un cas de "définir le bloc et les tailles de grille basée sur l'ensemble de problèmes" ou est-il plus intéressant d'attribuer bloc de dimensions comme des facteurs de 2 et certains ont dans le noyau de la logique de traiter avec le plus de déversement?

Je peux voir comment cela probablement beaucoup de questions pour le bloc de dimensions, mais combien cette question à la grille de dimensions? Si je comprends bien, le matériel réel des contraintes de s'arrêter au niveau du bloc (j'.e blocs affecté à la SM qui ont un certain nombre de SP, et peut donc traiter une courbure particulière de la taille).

J'ai pris connaissance de Kirk de la Programmation des Processeurs Massivement Parallèles", mais il n'a pas vraiment de pression sur cette zone.

InformationsquelleAutor Bolster | 2011-04-27