Spark RDD à DataFrame python

Je suis en train de convertir l'Étincelle RDD à un DataFrame. J'ai vu de la documentation et de l'exemple où le régime est passé à
sqlContext.CreateDataFrame(rdd,schema) fonction.

Mais j'ai 38 colonnes ou des champs et cela va encore augmenter. Si j'manuellement donner le schéma spécifiant chaque champ de l'information, qu'il va être trop fastidieux.

Est-il un autre moyen de spécifier le schéma sans connaître les informations des colonnes avant.

si vous avez 38 colonnes, pourquoi travaillez-vous avec des RDD en premier lieu? pourquoi ne pas débuter avec DataFrame?
Je suis le chargement de données de Graphe Neo4j. Où les données sont récupérées comme CA et d'avoir quelques dépendances.

OriginalL'auteur Jack Daniel | 2016-09-26