CUDA détermination de threads par bloc, les blocs par grille

Je suis nouveau sur le CUDA de paradigme. Ma question est de déterminer le nombre de threads par bloc, et par blocs de la grille. Un peu d'art et d'essai de jouer dans ce processus? Ce que j'ai trouvé, c'est que de nombreux exemples l'ont apparemment nombre arbitraire choisie pour ces choses.

Je suis en train d'étudier un problème où je voudrais être en mesure de passer des matrices de toute taille à une méthode de multiplication. De sorte que, chaque élément de C (C = A * B) est calculé par un seul thread. Comment voulez-vous déterminer le fils de bloc, les blocs/grille dans ce cas?

InformationsquelleAutor dnbwise | 2010-12-08