Pyspark: afficher une étincelle bloc de données dans un format de table

Je suis en utilisant pyspark de lire un parquet fichier comme ci-dessous:

my_df = sqlContext.read.parquet('hdfs://myPath/myDB.db/myTable/**')

Puis, quand je ne my_df.take(5), il va montrer [Row(...)], au lieu d'un format de tableau comme lorsque nous utilisons les pandas bloc de données.

Est-il possible d'afficher le bloc de données dans un format de table comme les pandas bloc de données? Merci!

essayez ceci: my_df.take(5).show()
Je suis d'erreur: <ipython-entrée-14-d14c0ee9b9fe> <module>() ----> my_df.(5).show() AttributeError: 'liste' de l'objet n'a pas d'attribut "show"
il devrait être my_df.show().take(5)
comment est .(5).show() différent de juste .show(5)? Est-il plus rapide?

OriginalL'auteur Edamame | 2016-08-21