Pourquoi n'est-ce pas Hadoop mis en œuvre à l'aide de MPI?

Corrigez-moi si je me trompe, mais ma compréhension est que Hadoop ne pas utiliser MPI pour la communication entre les différents nœuds.

Quelles sont les raisons techniques à cela?

Je pourrais danger quelques devine, mais je ne sais pas comment MPI est mis en œuvre "sous le capot" pour savoir si, oui ou non, je suis à droite.

Venez pour penser à elle, je ne suis pas entièrement familier avec Hadoop internals soit. Je comprends le cadre au niveau conceptuel (carte/combiner/shuffle/réduire et comment cela fonctionne à un niveau élevé), mais je ne connais pas les tenants et aboutissants de la mise en œuvre de détails. J'ai toujours supposé que Hadoop a été transmission de données sérialisées structures (peut-être GPBs) sur une connexion TCP, par exemple, pendant la lecture aléatoire de phase. Laissez-moi savoir si ce n'est pas vrai.

InformationsquelleAutor artif | 2011-01-04