DISTRIBUER PAR la clause de la RUCHE

Je ne suis pas en mesure de comprendre ce que c'DISTRIBUER PAR la clause ne dans la RUCHE. Je sais que la définition qui dit que , si nous avons de distribution PAR (ville) , ce serait envoyer chaque ville dans un autre RÉDUCTEUR mais je n'obtiens pas le même. Permettez-nous de considérer les données comme suit :

Données de la TABLE:

+----------+--------+
| username | amount |
+----------+--------+
| user_1   | 25     |
+----------+--------+
| user_1   | 53     |
+----------+--------+
| user_1   | 28     |
+----------+--------+
| user_1   | 50     |
+----------+--------+
| user_2   | 20     |
+----------+--------+
| user_2   | 50     |
+----------+--------+
| user_2   | 10     |
+----------+--------+
| user_2   | 5      |
+----------+--------+

Dire que nous avons une TABLE de données avec des colonnes nom d'utilisateur et montant.

Maintenant Si je dis -

select username,sum(amount) from data DISTRIBUTE by (name)

Ne devrait pas ce run 2 réducteurs ? Il est toujours en cours d'exécution un seul réducteur je ne sais pas pourquoi ? Je pensais que cela peut avoir à faire avec le regroupement DANS des SEAUX OU de PARTITIONNEMENT, mais j'ai tout essayé , là encore, il s'exécute une seule réducteur quelqu'un peut-il expliquer pourquoi ?

OriginalL'auteur User9523 | 2017-02-14