le programme d'installation et de nettoyage méthodes de Mapper/Réducteur dans Hadoop MapReduce
Sont de configuration et de nettoyage méthodes appelées dans chaque mappeur et réducteur de tâches respectivement? Ou sont-ils appelé qu'une seule fois au début de global mapper et réducteur de l'emploi?
Vous devez vous connecter pour publier un commentaire.
Ils sont appelés pour chaque tâche, donc si vous avez 20 mappeurs en cours d'exécution, le programme d'installation /de nettoyage sera appelée pour chaque un.
Un gotcha est la norme de la méthode run pour les deux Mappeur et Réducteur de ne pas attraper les exceptions autour de la carte /réduire méthodes - donc, si une exception est levée dans ces méthodes, le nettoyage de la méthode ne sera pas appelé.
try/catch
clauses de les attraper.Une clarification est utile. Le programme d'installation/méthodes de nettoyage sont utilisés pour l'initialisation et le nettoyer au niveau de la tâche. Au sein d'une tâche, l'initialisation se passe avec un seul appel de méthode setup() et ensuite tous les appels à la carte() [ou de réduire()] la fonction qui va être fait. Après un autre appel sera fait à cleanup() la méthode avant de sortir de la tâche.
Il est appelé par la tâche du Mappeur ou Réducteur de la tâche.
Voici les hadoop code.
Selon la documentation sur mapreduce
le programme d'installation et de nettoyage sont appelés pour chaque Mappeur et Réducteur de tâches.
sur le réducteur, vous pouvez sur le travail faire le travail.setNumReduceTasks(1); et de cette façon, l'installation et le nettoyage de l'réducteur seront les seuls à être exécuté une seule fois.