Comment faire pour convertir un fichier JSON pour le parquet à l'aide d'Apache Spark?

Je suis nouveau sur Apache Spark 1.3.1. Comment puis-je convertir un fichier JSON pour Parquet?

Vous pouvez également utiliser Apache Drill (peut-être plus facile pour l'installation), vous pouvez convertir en JSON à partir d'un local-système de fichiers HDFS Parquet en 1 ligne de SQL: "CRÉER une TABLE de dfs.de forage./test5/ As (SELECT * from dfs.gen./2016/10/*/*.json e);", si vous êtes intéressé => drill.apache.org/docs/parquet-format.

OriginalL'auteur eddard.stark | 2016-01-12