CUDA: non valide appareil ordinale

J'ai le problème suivant. Je veux permettre à mes utilisateurs de choisir les GPU pour exécuter sur. Donc j'ai été le tester sur ma machine qui n'a qu'un seul GPU (périphérique 0) ce qui arriverait si ils choisissent un appareil qui n'existe pas.

Si je ne cudaSetDevice(0); cela fonctionnera très bien.

Si je fais: cudaSetDevice(1); il va se planter avec invalid device ordinal (je peux gérer ce que la fonction renvoie une erreur).

Si je fais: cudaSetDevice(0); cudaSetDevice(1); il va se planter avec invalid device ordinal (je peux gérer ce que la fonction renvoie une erreur).

Toutefois! Si je fais: cudaSetDevice(1); cudaSetDevice(0); la deuxième commande renvoie succès mais sur le premier calcul j'ai essayer de calculer sur mon GPU il va se planter avec invalid device ordinal. Je ne peut pas gérer ce que la deuxième commande ne retourne pas une erreur!

Il me semble que la première cudaSetDevice laisse un peu traîner, ce qui affecte le deuxième commandement?

Merci beaucoup!

Solution: (Merci à Robert Crovella!).
J'ai été à traiter les erreurs comme:

error = cudaSetDevice(1); 
if (error) { blabla }

Mais apparemment, vous avez besoin d'appeler cudaGetLastError() après le cudaSetDevice(1) parce que sinon, le message d'erreur n'est pas supprimé de certains pile d'erreur et il se bloque plus tard, où je faisais cudaGetLastError() pour une autre fonction, même si il n'y a pas d'erreur à ce stade.

InformationsquelleAutor Stefan | 2014-03-04

cuda

3

Vous avez pour vérifier le nombre de GPU sont disponibles dans votre système d'abord. Il est possible par l'utilisation de cudaGetDeviceCount.
```
int deviceCount = 0;
cudaGetDeviceCount(&deviceCount);
```
De vérifier ensuite si la saisie de l'utilisateur est supérieure à la périphériques disponibles.
```
if (userDeviceInput < deviceCount)
{
  cudaSetDevice(userDeviceInput);
}
else
{
  printf("error: invalid device choosen\n");
}
```
Rappeler quecudaSetDeviceest de 0 basée sur des indices! À cet effet, je check userDeviceInput < deviceCount.
- Oui, c'est un bon moyen de l'éviter. Je voudrais savoir si pourquoi ça ne marche pas.
- Il aide si vous avez un complet exemple. Votre vérification des erreurs peuvent être à l'aide de cudaPeekAtLastError() qui n' pas effacer le code d'erreur. Il retourne la dernière erreur à chaque fois que vous demandez pour elle (comme après votre noyau à lancer). Au lieu de cela, cudaGetLastError() va effacer le message d'erreur qu'il est rentré (c'est à dire un avenir case ne renvoie plus d'erreur, il sera de retour cudaSuccess si pas de nouvelles erreurs se produisent). Ce qui est différent de l'API de renvoyer le code d'erreur. Si vous souhaitez que le noyau de lancement à ne pas, ne cudaGetLastError quelque part avant, mais après le illégales cudaSetDevice(1) appel.
- J'aurais dit "Si vous souhaitez que le noyau de lancement à ne pas semble fail..."
- vous pouvez poster cela comme une réponse afin que je puisse l'accepter? Parce que vous étiez évidemment correct 🙂 Merci beaucoup!
- En réalité, j'étais de vérifier la valeur retournée par cudaSetDevice qui contient l'erreur mais ne la supprime pas de la pile d'erreur de cudaGetLastError.
- Je crois que les moyeux de réponse de plus, mon commentaire fait un bon de réponse. Vous êtes les bienvenus à l'accepter si vous le souhaitez. Mon commentaire seul, sans que vous n'en indiquant le type de vérification d'erreur que vous faisiez dans le détail, ne serait probablement pas faire beaucoup de sens. Nous pouvons déjà voir que mon commentaire a été mal parce que vous n'étiez pas à l'aide de cudaPeekAtLastError. Le manque de croustillant exemple dans votre question, il est difficile pour quiconque de réponse.
InformationsquelleAutor hubs

Vous devez vous connecter pour publier un commentaire.