Quels sont les avantages et les inconvénients de parquet format par rapport à d'autres formats?

Caractéristiques de Apache Parquet sont :

  • Auto-descriptif
  • Format de colonne
  • Indépendant de la langue

En comparaison à d'Avro, Séquence de Fichiers, Fichier RC etc. Je veux une vue d'ensemble des formats. J'ai déjà lu : Comment Impala Fonctionne avec les Formats de Fichiers Hadoop , il donne quelques indications sur les formats, mais je voudrais savoir comment l'accès aux données & le stockage des données se fait dans chacun de ces formats. Comment le parquet a un avantage sur les autres?

  • Un bon résumé peut être trouvé dans cette présentation: lien
  • Le lien est mort.
  • mis à jour.
InformationsquelleAutor Ani Menon | 2016-04-24