Point De Terminaison De Transport Non Connecté - Mesos Esclave / Maître
J'essaie de connecter un Mesos esclave à son maître. Whenver l'esclave tente de se connecter au maître, j'obtiens le message suivant:
I0806 16:39:59.090845 935 hierarchical.hpp:528] Added slave 20150806-163941-1027506442-5050-921-S3 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000] (allocated: )
E0806 16:39:59.091384 940 socket.hpp:107] Shutdown failed on fd=25: Transport endpoint is not connected [107]
I0806 16:39:59.091508 940 master.cpp:3395] Registered slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) with cpus(*):1; mem(*):1938; disk(*):3777; ports(*):[31000-32000]
I0806 16:39:59.091747 940 master.cpp:1006] Slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian) disconnected
I0806 16:39:59.091868 940 master.cpp:2203] Disconnecting slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092031 940 master.cpp:2222] Deactivating slave 20150806-163941-1027506442-5050-921-S3 at slave(1)@127.0.1.1:5051 (debian)
I0806 16:39:59.092248 939 hierarchical.hpp:621] Slave 20150806-163941-1027506442-5050-921-S3 deactivated
L'erreur semble être:
E0806 16:39:59.091384 socket 940.php:107] Arrêt a échoué sur fd=25: Transport de point de terminaison n'est pas connecté [107]
De l'armée a été commencé à utiliser:
./mesos-master.sh --ip=10.129.62.61 --work_dir=~/Mesos/mesos-0.23.0/workdir/--zk=zk://10.129.62.61:2181/mesos --quorum=1
Et l'esclave
./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos
Si je suis l'esclave sur la même machine virtuelle comme la machine sur laquelle il fonctionne.
Je ne pouvais pas trouver beaucoup d'informations sur l'internet. Je suis à court de deux virtuel boîtes (Debian 8.1) sur VirtualBox 5. L'hôte est un windows 7.
Edit 1:
Le maître et l'esclave à la fois exécuté sur une machine virtuelle.
Les deux VMs nextorks sont configurés à l'aide de pont réseau.
ifconfig de maître:
eth0 Link encap:Ethernet HWaddr 08:00:27:cc:6c:6e
inet addr:10.129.62.61 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fecc:6c6e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:5335953 errors:0 dropped:0 overruns:0 frame:0
TX packets:1422428 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:595886271 (568.2 MiB) TX bytes:362423868 (345.6 MiB)
ifconfig de l'esclave:
eth0 Link encap:Ethernet HWaddr 08:00:27:56:83:20
inet addr:10.129.62.49 Bcast:10.129.255.255 Mask:255.255.0.0
inet6 addr: fe80::a00:27ff:fe56:8320/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4358561 errors:0 dropped:0 overruns:0 frame:0
TX packets:3825 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:397126834 (378.7 MiB) TX bytes:354116 (345.8 KiB)
Edit 2:
L'esclave journaux peuvent être trouvés à http://pastebin.com/CXZUBHKr
Le maître des journaux peut être trouvé à http://pastebin.com/thYR1par
- Pouvez-vous afficher le résultat de
ipconfig
sur votre esclave? Je soupçonne que c'registre de maître avec de fausses IP - J'ai édité la question
- Je suggère, basé sur le document prise en main. Au lieu de
./mesos-slave.sh --master=zk://10.129.62.61:2181/mesos
, pouvez-vous essayer./mesos-slave.sh --master=10.129.62.61:5050
et voir si cela fonctionne? Parce que mesos-maîtriser le processus est à l'écoute sur le port 5050. - Je reçois la même erreur
Vous devez vous connecter pour publier un commentaire.
J'ai eu un problème similaire.
Mon esclave des journaux sont remplis avec
Mon maître aurait
Et le maître allait mourir, et une nouvelle élection, la tué maître allait être redémarré par upstart (je suis sur un Centos 6 la boîte) et être ajouté dans le bassin potentiel des maîtres. C'est ainsi que mon élu maître chaîne autour de mon maître nœuds. De nombreux redémarrages de maîtres et d'esclaves, n'ont en rien le problème serait constamment de retour dans un délai de 1 minute de maître de l'élection.
La solution pour moi est venu de ce stackoverflow question (merci) et d'un indicateur dans une github gist note.
L'essentiel, c'est
/etc/default/mesos-master
devez spécifier un quorum nombre (ça doit être correct pour le nombre de mesos maîtres, dans mon cas 3)Cela me semble bizarre que j'ai les mêmes informations dans le fichier
/etc/mesos-master/quorum
Mais je l'ai ajouté à
/etc/default/mesos-master
redémarré le mesos-les maîtres et les esclaves, et le problème n'a pas retourné.J'espère que cela vous aide.
MESOS_QUORUM=`cat /etc/mesos-master/quorum`
au lieuMESOS_QUORUM
au lieu de simplementQUORUM
que l'on pourrait croire, parce que tous les autres paramètres n'ont pas besoin d'unMESOS_
préfixe. Étrange... Semble comme bug pour moi.J'ai cette erreur dans les logs lors de la mise à niveau de mesos versions (par exemple, 0.20.0 -> 0.27.0). Parfois, les données de la version précédente est incompatible avec d'autres versions.
Voici comment j'ai remédié à ça:
D'abord s'assurer que tous les nœuds ont la mesos-maître arrêt de service:
Puis effacer tout le potentiel des données anciennes:
Supprimer
$MESOS_WORK_DIR
(/var/mesos
dans mon cas):Clair que notre mesos données dans ZooKeeper:
Après ces étapes, j'ai commencé la mesos-maître de service sur tous les nœuds et il est revenu en ligne.
/data/tmp/mesos/replicated_log/
sur tous les maîtres, au lieu de l'ensemble des travaux dir, puis aussi la gardienne d'animaux /mesos nœud. C'est documentée ici: mesos.apache.org/documentation/latest/operational-guide (en augmentant le quorum de la taille)C'est l'erreur de l'indice.
Votre esclave exposer la mauvaise adresse IP.
Ajouter
--ip=10.129.62.49
à l'esclave de commande et il fonctionne.Exécuter l'esclave avec
--ip=10.129.62.49
au lieu