Sélectionnez les colonnes dans Pyspark Dataframe

Je suis à la recherche d'un moyen de sélectionner les colonnes de mon dataframe dans pyspark. Pour la première ligne, je sais que je peux utiliser df.first() mais vous ne savez pas sur les colonnes étant donné qu'ils font ont pas de noms de colonne.

J'ai 5 colonnes et souhaitez faire une boucle par le biais de chacun d'eux.

+--+---+---+---+---+---+---+
|_1| _2| _3| _4| _5| _6| _7|
+--+---+---+---+---+---+---+
|1 |0.0|0.0|0.0|1.0|0.0|0.0|
|2 |1.0|0.0|0.0|0.0|0.0|0.0|
|3 |0.0|0.0|1.0|0.0|0.0|0.0|
  • que voulez-vous dire "ils n'ont pas de noms de colonne"? Veuillez nous faire part de la sortie de df.show().
  • édité mon post. Je vois maintenant comment je pourrais le faire mais je suis encore un peu confus sur une boucle dans chaque colonne.
InformationsquelleAutor Nivi | 2017-10-18