Hadoop namenode métadonnées
Je suis un peu confus par l'architecture Hadoop.
-
Quel type de fichier de métadonnées sont stockées dans Hadoop Namenode? Hadoop wiki, il est dit Namenode magasins de l'ensemble de l'espace de noms system. De l'information comme la dernière date de modification, date de création, taille du fichier, le propriétaire, les autorisations et etc stockées dans Namenode?
-
Ne datanode de stocker toutes les informations de métadonnées?
-
Il y a seulement un Namenode, peut les métadonnées de données dépassent le serveur est limite?
-
Si un utilisateur veut télécharger un fichier à partir d'Hadoop, a-t-il à le télécharger à partir du Namenode? J'ai trouvé ci-dessous l'architecture de l'image à partir du web, il montre un client peut directement écrire des données à datanode? Est-il vrai?
Merci!!!!!!!
- veuillez vérifier les détails ci-dessous en utilisant le secondaire nœud du nom de mplsvpn.info/2012/11/... ce qui concerne shivlu jain
Vous devez vous connecter pour publier un commentaire.
Je pense que l'explication suivante peut vous aider à mieux comprendre le HDFS architecture.
Vous pouvez envisager de Nom noeud à l'instar de fichiers FAT (file allocation table) + les données de l'Annuaire et les Données des nœuds pour muets les périphériques de bloc.
Si vous voulez lire le fichier du système de fichiers normal, vous devez aller dans le Répertoire, puis aller à la GRAISSE, obtenir les emplacements de tous les blocs et de les lire. La même chose arrive avec HDFS.
Si vous voulez lire le fichier, vous allez sur le Namenode, obtenez la liste des blocs le fichier donné en ont. Cette information sur les blocs contiendra la liste de datanodes où cette information assis. Après vous allez à la datanode et pertinente des blocs d'eux.
http://hadoop.apache.org/hdfs/docs/r0.21.0/hdfs_imageviewer.html
3) Lorsque le pas.de fichiers sont tellement énormes , un seul Namenode ne sera pas en mesure de garder tous les métadonnées . En fait, c'est une des limitations de HDFS . Vous pouvez le vérifier HDFS Fédération qui vise à remédier à ce problème en se divisant en différents espaces desservis par les différents namenodes .
4)
Pour le numéro de la question 4. Le Client ne fait qu'écrire des données directement à Datanode. Cependant, avant de pouvoir écrire à un DataNode, il doit parler le Namenode pour obtenir metatdata comme qui Datanode et qui bloquent à écrire à.
Oui, NameNode gère ces. Souvent aussi ces données seront enregistrées dans fsimage et de modifier les fichiers qui seront sur le disque local.
Non, toutes les métadonnées seront tenues par le NameNode. En raison de laquelle le datanode fardeau sera moins pour maintenir les métadonnées.
Il n'y aura plus qu'un NameNode. Comme je l'ai dit à gérer la limite de métadonnées taille, les données seront fréquemment enregistrés dans fsimage et des modifications à travers les points de contrôle.
Client peut contacter le DataNode une fois qu'il obtient les informations de fichier à partir de NameNode.