Spark dataframe: collect () vs select ()

Appel collect() sur un EDR sera de retour l'ensemble du jeu de données pour le conducteur qui peut causer de la mémoire et nous devons éviter que des.

Sera collect() se comportent de la même façon si elle est appelée sur un dataframe?
Quel est le select() méthode?
Ne travaillent de la même manière que collect() si elle est appelée sur un dataframe?

OriginalL'auteur Mrinal | 2017-05-25