Distinct sur une colonne spécifique dans Hive
Je suis en cours d'exécution de la Ruche 071
J'ai un tableau avec plusieurs lignes, avec la même valeur de la colonne
par exemple,
x | y |
---------
1 | 2 |
1 | 3 |
1 | 4 |
2 | 2 |
3 | 2 |
3 | 1 |
Je veux avoir le x de la colonne unique, et de supprimer les lignes qui ont le même x val
par exemple,
x | y |
---------
1 | 2 |
2 | 2 |
3 | 2 |
ou
x | y |
---------
1 | 4 |
2 | 2 |
3 | 1 |
sont à la fois bon
comme distincts ne fonctionne que sur l'ensemble de la rs dans la ruche, je ne pouvais pas trouver un moyen de le faire
aider s'il vous plaît
Tx
source d'informationauteur Tomer
Vous devez vous connecter pour publier un commentaire.
Vous pouvez utiliser le mot clé distinct:
essayer requête suivante pour obtenir le résultat :
sélectionner A. x , A. y from (select x , y , rank() over ( partition by x commande par y) selon le classement de testingg)where rang=1;