Le déclenchement de l'étincelle d'emplois avec le RESTE

J'ai été de la fin de l'essayer apache spark. Ma question est plus spécifique pour déclencher l'étincelle de l'emploi. Ici J'avais posté la question sur la compréhension de l'étincelle de l'emploi. Après l'obtention sale sur les emplois, je suis passée à mon exigence.

J'ai un RESTE de point de fin, où j'expose API pour déclencher des Emplois, j'ai utilisé Spring4.0 pour le Repos de mise en Œuvre. Maintenant aller de l'avant, j'ai pensé à la mise en œuvre des Emplois de Service au Printemps où je voudrais soumettre par programme de Travail, sens lorsque le point de terminaison est déclenchée, avec des paramètres donnés, je voudrais déclencher le travail.
J'ai maintenant quelques options de conception.

Similaire à ci-dessous d'emploi écrite, j'ai besoin de maintenir un certain nombre d'Emplois appelé par une Classe Abstraite peut être JobScheduler .

 /*Can this Code be abstracted from the application and written as 
  as a seperate job. Because my understanding is that the 
 Application code itself has to have the addJars embedded 
 which internally  sparkContext takes care.*/

 SparkConf sparkConf = new SparkConf().setAppName("MyApp").setJars(
 new String[] { "/path/to/jar/submit/cluster" })
 .setMaster("/url/of/master/node");
  sparkConf.setSparkHome("/path/to/spark/");

        sparkConf.set("spark.scheduler.mode", "FAIR");
        JavaSparkContext sc = new JavaSparkContext(sparkConf);
        sc.setLocalProperty("spark.scheduler.pool", "test");

    //Application with Algorithm , transformations

s'étendant au-dessus du point d'avoir plusieurs versions d'emploi gérées par le service.
Ou d'utiliser une Étincelle d'Emploi de Serveur pour ce faire.

Tout d'abord, je voudrais savoir quelle est la meilleure solution dans ce cas, l'exécution sage et aussi mise à l'échelle sage.

Note : je suis autonome à l'aide d'un cluster à partir de l'étincelle.
aide gentiment.

J'ai ajouté le Printemps pour Apache Hadoop balise à cette question. Spring Batch Admin fournit une API REST pour la gestion et le lancement de travaux et je crois que le Printemps pour Apache Hadoop fournit la capacité de lancer des Étincelles emploi de Spring Batch...
merci pour la suggestion, je vais certainement regarder.

InformationsquelleAutor chaosguru | 2015-03-11

6

Suffit d'utiliser l'Étincelle JobServer
https://github.com/spark-jobserver/spark-jobserver

Il y a beaucoup de choses à prendre en considération à la confection d'un service, et l'Étincelle JobServer a la plupart d'entre eux déjà couvertes. Si vous trouvez des choses qui ne sont pas assez bonnes, il devrait être facile de faire une demande et d'ajouter du code à leur système plutôt que de le réinventer à partir de zéro
- Également considérer avant d'utiliser l'Étincelle d'Emploi de Serveur - il ne supporte pas d'Étincelle plus récente que la 2.0. De plus, en regardant leurs commettre l'histoire - c'est pas super actif
- c'est plus active que celle de apache tite-live si.
- Spark Job Server a pris en charge Étincelle 2.2 pendant un certain temps, maintenant.
InformationsquelleAutor David
26

Il s'avère que l'Étincelle a caché API REST pour soumettre un travail d'impression, vérifier l'état et le tuer.

Découvrez exemple complet ici: http://arturmkrtchyan.com/apache-spark-hidden-rest-api
- Semble vraiment intéressant, trouvé ce issues.apache.org/jira/secure/attachment/12696651/... de sorte que ses moyens étincelle a exposé cette fonctionnalité?
- Autant que je sache, ils ont ajouté à partir de v1.4. Mais ils ne sont pas encore publiquement la promotion de encore.
- relly option intéressante, merci! Qu'advient-il si je vais présenter deux applications simultanément par l'intermédiaire d'Étincelle API REST?
- La page web que vous avez lié n'a pas vraiment dire quoi que ce soit car les photos sur la page sont morts.
- Celui-ci pourrait l'aider tandis que le principal lien fourni a brisé les images: gist.github.com/arturmkrtchyan/5d8559b2911ac951d34a
- est-il lancer une étincelle de session/contexte de tous les temps, il y a un appel à l'api rest, ou il utilise la même session ?
InformationsquelleAutor Artur Mkrtchyan
5

Tite-live est un open source RESTE de l'interface pour interagir avec Apache Spark à partir de n'importe où. Il prend en charge l'exécution des bouts de code ou de programmes dans une Étincelle contexte qui s'exécute localement ou dans Apache Hadoop YARN.
- Alors que ce lien peut répondre à la question, il est préférable d'inclure les parties essentielles de la réponse et de fournir le lien de référence. Lien-ne répond peut devenir non valide si la page liée changements. - Revue
- Vous avez raison, j'ai mis à jour ma réponse en donnant un peu plus de détails. Merci.
- Tite-live cycle de publication est bizarre. Ils libèrent presque comme une fois par an!
InformationsquelleAutor Josemy
1

Ici est un bon client que vous pourriez trouver utiles: https://github.com/ywilkof/spark-jobs-rest-client

Edit: cette réponse a été donnée en 2015. Il y a des options comme tite-Live actuellement disponible.
- vous ne savez pas si il est possible de laucnh deux applications simulateneously par le biais de ce client?
- Oui, c'est possible. Le client est juste un wrapper autour de HTTP appels vers votre étincelle maître. Donc, si votre installation peut gérer cela, alors il sera possible.
InformationsquelleAutor Alex Fedulov

Vous devez vous connecter pour publier un commentaire.