Hadoop: Nombre de cartographes et les réducteurs

J'ai couru Hadoop MapReduce sur 1,1 GO fichier plusieurs fois avec un nombre différent de cartographes et les réducteurs (par exemple, 1 mappeur et 1 réducteur, 1 mappeur et 2 réducteurs, 1 mappeur et 4 réducteurs, ...)

Hadoop est installé sur quad-core avec hyper-threading.

Voici le top 5 résultat trié par le plus court temps d'exécution:

+----------+----------+----------+
|  time    | # of map | # of red |
+----------+----------+----------+
| 7m 50s   |    8     |    2     |
| 8m 13s   |    8     |    4     |
| 8m 16s   |    8     |    8     |
| 8m 28s   |    4     |    8     |
| 8m 37s   |    4     |    4     |
+----------+----------+----------+

Modifier

Le résultat, pour les 1 - 8 réducteurs et 1 - 8 mappeurs:
colonne = nombre de mappers
ligne = # de réducteurs

+---------+---------+---------+---------+---------+
|         |    1    |    2    |    4    |    8    |
+---------+---------+---------+---------+---------+
|    1    |  16:23  |  13:17  |  11:27  |  10:19  |
+---------+---------+---------+---------+---------+
|    2    |  13:56  |  10:24  |  08:41  |  07:52  |
+---------+---------+---------+---------+---------+
|    4    |  14:12  |  10:21  |  08:37  |  08:13  |  
+---------+---------+---------+---------+---------+
|    8    |  14:09  |  09:46  |  08:28  |  08:16  |
+---------+---------+---------+---------+---------+

(1)
Il semble que le programme tourne légèrement plus vite quand j'ai 8 cartographes, mais pourquoi est-il ralentir comme je l'augmentation du nombre de réducteurs? (par exemple, 8mappers/2reducers est plus rapide que 8mappers/8reducers)

(2)
Lorsque j'utilise seulement 4 cartographes, c'est un peu plus lent, tout simplement parce que je ne suis pas en utilisant l'autre de 4 cœurs, droit?

Selon votre description, il est installé sur 1 de la machine, de sorte qu'il est le maître et il n'existe pas de nœuds supplémentaires?? Êtes-vous à l'aide d'un cluster?
Oui, il est installé sur 1 machine qui est un quad-core avec hyper-threading.
Combien de fois avez-vous essayé de chaque étape? Que voyez-vous dans les compteurs, sont de réduire les touches bien réparties? Il est assez difficile de dire quoi que ce soit sans compteurs, des journaux et de la configuration.
Combien de disques physiques sont disponibles pour ce pseudo?
Je voudrais voir 1,2,4,8 mappeurs de chacun avec 1,2,4,8 réducteurs aussi.

OriginalL'auteur kabichan | 2013-12-01