Quelles sont les conditions de cluster déployer mode d'être utilisé à la place du client?

La doc https://spark.apache.org/docs/1.1.0/submitting-applications.html

décrit déployer-mode :

--deploy-mode: Whether to deploy your driver on the worker nodes (cluster) or locally as an external client (client) (default: client)

À l'aide de ce diagramme fig1 comme un guide (prises de http://spark.apache.org/docs/1.2.0/cluster-overview.html) :

Quelles sont les conditions de cluster déployer mode d'être utilisé à la place du client?

Si j'ai le coup d'envoi d'une Étincelle d'emploi :

./bin/spark-submit \
  --class com.driver \
  --master spark://MY_MASTER:7077 \
  --executor-memory 845M \
  --deploy-mode client \
  ./bin/Driver.jar

Puis le Driver Program sera MY_MASTER comme spécifié dans fig1 MY_MASTER

Si j'utilise à la place --deploy-mode cluster puis le Driver Program seront partagés entre les Nœuds du Travailleur ? Si cela est vrai, alors cela signifie que le Driver Program boîte en fig1 peuvent être supprimés (comme il n'est plus utilisé) comme le SparkContext seront également partagés entre les nœuds du travailleur ?

Quelles sont les conditions à cluster être utilisé à la place de client ?

InformationsquelleAutor blue-sky | 2015-03-02