Comment les données sont réparties dans Hadoop

Ne Hadoop diviser les données en fonction du nombre de mappers défini dans le programme? C'est, d'avoir un ensemble de données de taille de 500 MO, si le nombre de contributeurs est de 200 (en supposant que le cluster Hadoop permet de 200 utilisateurs simultanés), est chaque mappeur compte tenu de 2,5 MO de données?

En outre,faire toutes les mappeurs de fonctionner simultanément ou certains d'entre eux peuvent se faire rouler dans la série?

OriginalL'auteur H.Z. | 2013-07-03