Le cluster RabbitMQ ne se reconnecte pas après une panne réseau

J'ai RabbitMQ cluster à deux nœuds dans la production et le cluster est en rupture avec ces messages d'erreur:

=RAPPORT d'ERREUR==== 23-Déc-2011::04:21:34 ===
** Nœud de lapin@rabbitmq02 pas de réponse **
** La suppression (timedout) de la connexion **

=INFO RAPPORT==== 23-Déc-2011::04:21:35 ===
nœud de lapin@rabbitmq02 perdu lapin

=RAPPORT d'ERREUR==== 23-Déc-2011::04:21:49 ===
Amnésie & nbsp; (lapin@rabbitmq01): ** ERREUR ** mnesia_event obtenu {inconsistent_database, running_partitioned_network, lapin@rabbitmq02}

J'ai essayé de simuler le problème en tuant la connexion entre les deux nœuds à l'aide de "tcpkill", le cluster s'est déconnecté,et, étonnamment, les deux nœuds ne sont pas essayer de renouer !

Lorsque le cluster des pauses, haproxy équilibreur de charge marque encore les deux nœuds actifs et envoyer la demande à la fois d'entre eux, bien qu'ils ne sont pas dans un cluster.

Mes questions:

  1. Si les nœuds sont configurés pour fonctionner en tant que cluster, quand j'ai une panne de réseau , pourquoi ne sont-ils pas essayer de se reconnecter après ?
  2. Comment puis-je identifier les brisées de cluster et de l'arrêt de l'un des nœuds ? J'ai des problèmes de cohérence lorsque l'on travaille avec les deux nœuds séparément.

source d'informationauteur Ranch