Laquelle de nombreux Spark/Scala noyaux pour Jupyter/IPython choisir?
Il y a beaucoup de Scala/Spark noyaux pour IPython/Jupyter:
Quelqu'un sait qui d'entre eux est le plus compatible avec IPython/Jupyter et plus confortable à utiliser avec:
- Scala
- Étincelle(Scala)
- Le IPython wiki a une liste de plusieurs noyaux (y compris d'autres langues en plus de la scala). Pensé que je voudrais ajouter c'est ici: github.com/ipython/ipython/wiki/...
- Utile à commenter si ceux-ci viennent en tant que source, binaire, ou les deux. Et la facilité d'installation, à la fois sur Win10/Linux/MacOS. Aussi, comment ils se comparent les uns aux autres sur CPU et de la mémoire de la performance? de sécurité? les patchs? la magie des commandes?
Vous devez vous connecter pour publier un commentaire.
Je ne peux pas parler pour eux tous, mais j'utilise Étincelle du Noyau et il fonctionne très bien pour l'utilisation à la fois de la Scala et de la bougie.
J'ai trouvé IScala et Jupyter Scala moins stable et moins poli. Jupyter Scala permet d'imprimer chaque valeur de la variable après j'exécute une cellule; je ne veux pas voir cette 99% du temps.
Étincelle Noyau est mon préféré. À la fois pour la Spark et la plaine de vieux Scala.
Étincelle Noyau a été accepté dans Apache Incubateur et a déplacé la totalité de développement de Apache Toree.
J'ai été en utilisant spark-noyau (option #4) et tout à fait satisfait.
Vous trouverez une belle façon à l'installation (CDH 5.5 sur CentOS 7) ici (j'ai utilisé moi-même à l'installer dans un Seul nœud dans le pseudo-mode distribué).
http://www.davidgreco.me/blog/2015/12/24/how-to-use-jupyter-with-spark-kernel-and-cloudera-hadoop-slash-spark/