Comment faire pour exécuter un script dans PySpark
Je suis en train d'exécuter un script dans le pyspark environnement, mais jusqu'à présent, je n'ai pas pu. Comment puis-je exécuter un script comme python script.py mais dans pyspark? Grâce
Vous devez vous connecter pour publier un commentaire.
Que vous pouvez faire:
./bin/spark-submit mypythonfile.py
Lancer python applications par le biais de
pyspark
n'est pas pris en charge comme de Spark 2.0.spark-submit
fichierpyspark 2.0 et plus tard exécuter le fichier de script dans la variable d'environnement
PYTHONSTARTUP
, de sorte que vous pouvez exécuter:Par rapport à
spark-submit
répondre à cette question est utile pour l'exécution de code d'initialisation de l'avant à l'aide de l'interactif pyspark shell.Juste
spark-submit mypythonfile.py
devrait être suffisant.