Qu'est-ce que l'Étincelle DataFrame la méthode `toPandas` en train de faire?

Je suis un débutant de la Spark-DataFrame de l'API.

J'utilise ce code pour charger csv séparé par des tabulations dans Spark Dataframe

lines = sc.textFile('tail5.csv')
parts = lines.map(lambda l : l.strip().split('\t'))
fnames = *some name list*
schemaData = StructType([StructField(fname, StringType(), True) for fname in fnames])
ddf = sqlContext.createDataFrame(parts,schemaData)

Supposons que je créer DataFrame avec Étincelle de nouveaux fichiers, et de les convertir pandas à l'aide intégrée dans la méthode toPandas(),

  • T-il stocker les Pandas objet de la mémoire locale?
  • Ne Pandas faible niveau de calcul est occupé de tous par Étincelle?
  • T-il exposé tous les pandas dataframe de la fonctionnalité?(Je suppose que oui)
  • Puis-je convertir toPandas et de le faire juste avec elle, sans pour autant toucher DataFrame de l'API?