Quels sont les différents types de jointure dans Spark?
J'ai regardé les docs et il dit ce qui suit types de jointure sont pris en charge:
Type de jointure à effectuer. Par défaut intérieure. Doit être: intérieure, de la croix,
extérieur, complet, full_outer, à gauche, left_outer, droit, right_outer,
left_semi, left_anti.
J'ai regardé la StackOverflow répondre sur les jointures SQL et haut couple de réponses de ne pas mentionner certains des jointures à partir de ci-dessus par exemple left_semi
et left_anti
. Que signifient-ils dans l'Étincelle?
Vous devez vous connecter pour publier un commentaire.
Ici est une simple illustration expérience:
Sortie
Aimé Pathikrit l'exemple. Voici une traduction possible en Java à l'aide d'Étincelle v2 et dataframes, y compris les rejoindre.
Je vais mettre cet exemple dans le Spark en Action, 2e's chapitre 12 référentiel.
Gauche Semi renvoie des lignes où la clé de jointure est trouvé dans les deux tables, mais elle inclut uniquement les champs de la table de gauche.
Gauche Anti renvoie des lignes où la clé de jointure se trouve uniquement dans la table de gauche.
De bonnes descriptions des différents types de jointure:
https://www.cloudera.com/documentation/enterprise/latest/topics/impala_joins.html