Quelle est la différence entre un seul noeud & amp; mode pseudo-distribué dans Hadoop?
Je voudrais savoir quelle est la différence de la configuration de point de vue ainsi que point de vue théorique?
Ces deux modes d'utilisation différents numéros de port? ou toute autre différence?
source d'informationauteur yedapoda
Vous devez vous connecter pour publier un commentaire.
Mes 2 cents.
Seul nœud de configuration (programme d'installation autonome)
Par défaut, Hadoop est configuré pour s'exécuter dans un non-distribués ou en mode autonome, comme un seul processus Java. Il n'y a pas les démons de la course et tout s'exécute dans une seule instance de la JVM. HDFS est pas utilisé.
Vous n'avez pas à faire quelque chose d'aussi loin que la configuration est concerné, sauf les
JAVA_HOME
. Il suffit de télécharger l'archive, décompressez-le, et vous êtes bon pour aller.Pseudo-mode distribué
Hadoop démons s'exécuter sur une machine locale, donc de la simulation d'un cluster sur une petite échelle. Différents Hadoop démons exécuter dans les différentes JVM cas, mais sur une seule machine. HDFS est utilisé à la place de locaux FS.
Autant que les pseudo-distribué le programme d'installation, vous devez définir au moins 2 propriétés ainsi que
JAVA_HOME
:fs.default.name
danscore-site.xml
.mapred.job.tracker
dansmapred-site.xml
.Vous pourriez avoir plusieurs datanodes et tasktrackers, mais cela ne fait pas beaucoup de sens sur une seule machine.
HTH
Un seul nœud de configuration est celle où vous avez (sans doute) un datanode et un tasktracker sur une seule machine.
Un pseudo-distribué le programme d'installation est le cas de plusieurs datanodes et (probablement) tasktrackers sur une seule machine. Si vous avez plusieurs instances d'un datanode service en cours d'exécution sur un seul ordinateur à imiter un multi-nœud de cluster.