Erreur d'API CUDA Runtime 38: aucun périphérique compatible CUDA n'est détecté
La Situation
J'ai un 2 gpu serveur (Ubuntu 12.04) où je suis passé d'une Tesla C1060 avec une GTX 670. Que j'ai installé CUDA 5.0 sur la 4.2. Ensuite, j'ai compilé tous les exemples execpt pour simpleMPI sans erreur. Mais quand je lance ./devicequery
- je obtenir message d'erreur suivantes:
foo@bar-serv2:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Ce que j'ai essayé
Pour résoudre cela, j'ai essayé tous de pense recommandés par CUDA-dispositif capable d'mais en vain:
/dev/nvidia*
est là et que les autorisations sont 666 (crw-rw-rw-) et propriétaire root:rootfoo@bar-serv2:/dev$ ls -l nvidia* crw-rw-rw- 1 root root 195, 0 Oct 24 18:51 nvidia0 crw-rw-rw- 1 root root 195, 1 Oct 24 18:51 nvidia1 crw-rw-rw- 1 root root 195, 255 Oct 24 18:50 nvidiactl
- J'ai essayé d'exécuter le code avec sudo
- CUDA 5.0 installe le pilote et les bibliothèques dans le même temps
PS ici est lspci | grep-i nvidia:
foo@bar-serv2:/dev$ lspci | grep -i nvidia
03:00.0 VGA compatible controller: NVIDIA Corporation GK104 [GeForce GTX 670] (rev a1)
03:00.1 Audio device: NVIDIA Corporation GK104 HDMI Audio Controller (rev a1)
04:00.0 VGA compatible controller: NVIDIA Corporation G94 [Quadro FX 1800] (rev a1)
[mise à jour]
foo@bar-serv2:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ nvidia-smi -a
NVIDIA: API mismatch: the NVIDIA kernel module has version 295.59,
but this NVIDIA driver component has version 304.54. Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error
Comment ça pourrait être, si j'utilise CUDA 5.0 programme d'installation pour installer le pilote et libs dans le même temps. Pourrait l'ancienne version 4.2, qui est toujours couché autour de gâcher les choses?
source d'informationauteur Framester
Vous devez vous connecter pour publier un commentaire.
Je suis tombé sur ce problème, et en cours d'exécution
m'a informé d'une API d'incompatibilité. Le problème était que ma distro Linux avait installé les mises à jour que nécessaire de redémarrer le système, de sorte que le redémarrage a résolu le problème.
Voir ce débordement de pile question L'installation de cuda 5 échantillons dans Ubuntu 12.10.
Ubuntu 12 ne constitue pas une distro Linux (encore). Pour référence, voir CUDA Toolkit 5.0 Notes de Version Et Errata
** Distributions Actuellement Pris En Charge
Si vous voulez le faire fonctionner sur Ubuntu 12 toute façon alors de voir la réponse de rpardo. Il ressemble à cette distribution au lieu d'installer des bibliothèques 64 bits pour
/usr/lib64
installe à/usr/lib/x86_64-linux-gnu/
Je vous suggère de rechercher toutes les instances de
libcuda.so
etlibnvidia-ml.so
sur le système. Étant donné que le pilote ne prend pas en charge cette distribution, il peut avoir installé les bibliothèques d'un chemin qui n'est pas fait parLD_LIBRARY_PATH
. Puis déplacer les bibliothèques et/ou de modifier lesLD_LIBRARY_PATH
à point à cet endroit (il devrait être le premier chemin sur la gauche). Ensuite réessayer denvidia-smi
oudeviceQuery
Bonne chance
Je suis d'erreur 38 pour cudaGetDeviceCount sur une machine windows avec GTX980 GPU.
Après, j'ai téléchargé le dernier pilote pour la GTX 980 bof le site NVIDIA, installé et redémarré, tout va bien. Ressemble le CUDA de l'installateur n'est pas de l'installation de la dernière version du pilote.
Essayez d'exécuter l'exemple de l'utilisation de sudo (ou bien, vous pouvez faire un 'sudo su', la valeur de LD_LIBRARY_PATH pour le chemin de cuda bibliothèques et exécuter l'exemple, tout en étant root). Apparemment, puisque vous avez probablement installé CUDA 5.0 à l'aide de sudo, les échantillons ne fonctionne pas avec la normale de l'utilisateur. Toutefois, si vous exécutez un échantillon avec la racine, alors vous serez en mesure d'exécuter les échantillons avec de l'utilisateur régulier de trop! Je n'ai pas encore redémarré le système pour voir si les échantillons de travail avec un utilisateur normal, même après redémarrage de la machine, ou à chaque fois que vous devez exécuter au moins une application CUDA avec la racine.
Le problème peut disparaître complètement si vous installez CUDA TookKit sans l'utilisation de sudo.
J'avais le même problème sur Debian et il s'avère que chargé
nvidia
module a version différente de cellelibcuda1
.Pour vérifier installé
nvidia
module que vous devez faire:Si elle ne correspond pas à la version de
libcuda1
ce la racine de vos problèmes.