Comment puis-je fusionner étincelle fichiers de résultats sans repartitionner et copyMerge?

J'utilise le code suivant:

csv.saveAsTextFile(pathToResults, classOf[GzipCodec])

pathToResults répertoire a beaucoup de fichiers, comme partie-0000, partie-0001 etc.
Je peux utiliser FileUtil.copyMerge(), mais c'est vraiment lent, c'est de téléchargement de tous les fichiers de pilote de programme et puis les charger dans hadoop. Mais FileUtil.copyMerge() plus rapide que:

csv.repartition(1).saveAsTextFile(pathToResults, classOf[GzipCodec])

Comment puis-je fusionner étincelle fichiers de résultats sans repartitionner et FileUtil.copyMerge()?

OriginalL'auteur Leonard | 2015-03-13