Comment obtenir la différence entre deux DataFrames?

Dans le SparkSQL 1.6 API (scala) Dataframe a des fonctions pour se croisent et sauf, mais pas pour la différence. De toute évidence, une combinaison de l'union et à l'exception peut être utilisé pour générer de la différence:

df1.except(df2).union(df2.except(df1))

Mais cela semble un peu maladroit. Dans mon expérience, si quelque chose semble maladroit, il y a une meilleure façon de le faire, notamment en Scala.

source d'informationauteur WillD