Comment éviter de dupliquer les colonnes après les rejoindre?

J'ai deux dataframes avec les colonnes suivantes:

df1.columns
// Array(ts, id, X1, X2)

et

df2.columns
// Array(ts, id, Y1, Y2)

Après je ne

val df_combined = df1.join(df2, Seq(ts,id))

Je me retrouve avec les colonnes suivantes: Array(ts, id, X1, X2, ts, id, Y1, Y2). J'ai pu s'attendre à ce que le commun des colonnes serait tombé. Est-il quelque chose que d'autres qui doit être fait?

Si vous avez défini les colonnes de jointure comme un Seq de chaînes de caractères (pour les noms de colonnes), puis les colonnes ne doivent pas être dupliqués. Voir ma réponse ci-dessous.

OriginalL'auteur Neel | 2016-02-07