Est gzip format pris en charge dans l'Étincelle?

Pour un Grand projet de Données, je suis à la planification de l'utilisation de spark, qui a quelques fonctionnalités intéressantes comme dans la mémoire des calculs répétés des charges de travail. Il peut s'exécuter sur les fichiers locaux ou sur le dessus de HDFS.

Cependant, dans la documentation officielle, je ne trouve aucune indication quant à la façon de traiter les fichiers gzip. Dans la pratique, il peut être très efficace pour traiter .gz fichiers au lieu de les fichiers décompressés.

Est-il un moyen de mettre en œuvre manuellement la lecture de fichiers au format gzip ou décompression est déjà fait automatiquement lors de la lecture .fichier gz?

InformationsquelleAutor ptikobj | 2013-04-30