Configuration de l'Étincelle de travailler avec Jupyter Portable et d'Anaconda

J'ai passé quelques jours en essayant de faire des Étincelles avec mon Jupyter Portable et Anaconda. Voici ce que mes .bash_profile ressemble:

PATH="/my/path/to/anaconda3/bin:$PATH"

export JAVA_HOME="/my/path/to/jdk"
export PYTHON_PATH="/my/path/to/anaconda3/bin/python"
export PYSPARK_PYTHON="/my/path/to/anaconda3/bin/python"

export PATH=$PATH:/my/path/to/spark-2.1.0-bin-hadoop2.7/bin
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark
export SPARK_HOME=/my/path/to/spark-2.1.0-bin-hadoop2.7
alias pyspark="pyspark --conf spark.local.dir=/home/puifais --num-executors 30 --driver-memory 128g --executor-memory 6g --packages com.databricks:spark-csv_2.11:1.5.0"

Quand je tape /my/path/to/spark-2.1.0-bin-hadoop2.7/bin/spark-shell, je peux lancer Spark très bien dans ma ligne de commande shell. Et la sortie sc n'est pas vide. Il semble bien fonctionner.

Quand je tape pyspark, il se lance sur mon Jupyter Portable amende. Quand je crée un nouveau Python3 notebook, cette erreur s'affiche:

[IPKernelApp] WARNING | Unknown error in handling PYTHONSTARTUP file /my/path/to/spark-2.1.0-bin-hadoop2.7/python/pyspark/shell.py: 

Et sc dans mon Jupyter ordinateur Portable est vide.

Quelqu'un peut-il aider à résoudre cette situation?


Voulez juste pour préciser: Il n'y a rien après les deux-points à la fin de l'erreur. J'ai aussi essayé de créer mon propre fichier de démarrage à l'aide de cette post et je cite ici, donc vous n'avez pas à aller regarder là:

J'ai réalisé un petit script d'initialisation init_spark.py comme suit:

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("yarn-client")
sc = SparkContext(conf = conf)

et placé dans le ~/.ipython/profile_default/démarrage/répertoire

Quand j'ai fait cela, l'erreur est alors devenu:

[IPKernelApp] WARNING | Unknown error in handling PYTHONSTARTUP file /my/path/to/spark-2.1.0-bin-hadoop2.7/python/pyspark/shell.py:
[IPKernelApp] WARNING | Unknown error in handling startup files:
Qu'est-ce que le reste du texte de l'avertissement? Il y a deux points à la fin de la ligne, est-il quelque chose qui vient après?
Non! Elle est vide. Il n'y a rien après la virgule.
Si vous supprimez ce alias ligne, ou essayez de supprimer certaines options? Le message d'erreur de changement?
Juste essayé de supprimer les alias. Pas de différence. Toujours la même erreur 🙁
Voici un lien qui pourrait peut-être contribuer à stackoverflow.com/questions/33908156/.... L'ajout de pyspark-shell pour PYSPARK_SUBMIT_ARGS est la clé.

OriginalL'auteur puifais | 2017-12-15