Comment écrire pyspark dataframe de HDFS et puis comment le lire dans dataframe?

J'ai un très gros pyspark dataframe. Je tiens donc à effectuer le pré traitement sur des sous-ensembles, puis les stocker sur hdfs. Plus tard, j'ai envie de tous les lire et de les fusionner ensemble. Merci.

OriginalL'auteur Ajg | 2017-05-31