Pyspark 'PipelinedRDD' objet n'a pas d'attribut "show"
J'
Je veux découvrir ce que tous les éléments dans le df qui ne sont pas en df1 , aussi les articles en df1, mais pas dans le df
df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
df2 = df.subtract(df1)
df2.show()
df3 = df1.subtract(df)
df3.show()
Voulez juste pour vérifier le résultat pour voir si j'ai bien compris la fonction.
Mais eu cette erreur
'PipelinedRDD' objet n'a pas d'attribut "show"
toute suggestion?
OriginalL'auteur newleaf | 2016-12-15
Vous devez vous connecter pour publier un commentaire.
df.show()
est seulement pour spark DataFrameOriginalL'auteur Zhang Tong
Convertir un edr pour une étincelle dataframe avec createDataFrame
OriginalL'auteur leo