Données Pandas à RDD

Puis-je convertir des Pandas Dataframe de RDD?

if isinstance(data2, pd.DataFrame):
    print 'is Dataframe'
else:
    print 'is NOT Dataframe'

est Dataframe

Voici le résultat lorsque vous essayez d'utiliser .ca

dataRDD = data2.rdd
print dataRDD

AttributeError                            Traceback (most recent call last)
<ipython-input-56-7a9188b07317> in <module>()
----> 1 dataRDD = data2.rdd
      2 print dataRDD

/usr/lib64/python2.7/site-packages/pandas/core/generic.pyc in __getattr__(self, name)
   2148                 return self[name]
   2149             raise AttributeError("'%s' object has no attribute '%s'" %
-> 2150                                  (type(self).__name__, name))
   2151 
   2152     def __setattr__(self, name, value):

AttributeError: 'DataFrame' object has no attribute 'rdd'

Je voudrais utiliser les Pandas Dataframe et pas sqlContext de construire comme je ne sais pas si toutes les fonctions de Pandas DF sont disponibles dans Spark. Si ce n'est pas possible, est-ce que quelqu'un peut fournir un exemple d'utilisation de Spark DF

source d'informationauteur kraster