Spark Dataset API - rejoindre

Je suis en train d'utiliser l'Étincelle Dataset API, mais je vais avoir quelques problèmes faisant une simple jointure.

Disons que j'ai deux jeu de données avec les champs: date | value, puis dans le cas de DataFrame mon rejoindre ressemblerait à:

val dfA : DataFrame
val dfB : DataFrame

dfA.join(dfB, dfB("date") === dfA("date") )

Cependant pour Dataset il est le .joinWith méthode, mais la même approche ne fonctionne pas:

val dfA : Dataset
val dfB : Dataset

dfA.joinWith(dfB, ? )

Qu'est-ce que l'argument requis par .joinWith ?

OriginalL'auteur mastro | 2016-04-06