quelle est la différence exacte entre Étincelle Transformer en DStream et de la carte.?
J'essaie de comprendre transformer Spark DStream Spark Streaming.
Je savais que transformer en beaucoup superlatif par rapport à la carte, mais
Peut quelqu'un me donner quelques en temps réel exemple ou exemple clair qui permette de différencier les transformer et de les carte.?
OriginalL'auteur Srini | 2015-08-23
Vous devez vous connecter pour publier un commentaire.
La
transform
fonction Spark streaming permet d'utiliser tout de Apache Spark de transformations sur le sous-jacentRDDs
pour le stream.map
est utilisé pour un élément de transformation, et peut être mis en œuvre à l'aide detransform
. Essentiellement,map
travaux sur les éléments de laDStream
ettransform
vous permet de travailler avec lesRDDs
de la DStream. Vous pouvez trouver http://spark.apache.org/docs/latest/streaming-programming-guide.html#transformations-on-dstreams être utile.OriginalL'auteur Holden
map
est une transformation élémentaire ettransform
est un EDR transformationcarte
Voici un exemple qui démontre à la fois la carte de l'opération et l'opération de transformation sur un DStream
la
map
ajoute 1 à chaque élément dans tous les Rdd dans DStream, donne une puissance comme indiqué ci-dessoustransformer
transformer permet d'effectuer des RDD fonctionnement, telles que la jointure, union etc sur les Rdd dans DStream, le code de l'exemple donné ici, va produire une sortie en tant que ci-dessous
ici la
commonRdd
qui contient l'élément0
est effectuée une opération union avec tous les sous-jacents Rdd dans le DStream.OriginalL'auteur remis haroon
DStream a Plusieurs CA, car à chaque intervalle de lot est un autre RDD.
Ainsi, en utilisant le transformer(), vous avez la chance d'appliquer un EDR opération sur le
toute la DStream.
Exemple de Spark Docs:
http://spark.apache.org/docs/latest/streaming-programming-guide.html#transform-operation
OriginalL'auteur uris
La fonction de transformation Spark Streaming vous permet d'effectuer tout type de transformation sur les sous-jacents de RDD en Flux. Par exemple, vous pouvez rejoindre des deux RDD en streaming à l'aide de Transformation dans lequel on CA serait certains RDD fabriqués à partir de fichier texte ou parallélisée de collecte et d'autres RDD est à venir à partir de Flux de texte/socket etc.
Carte fonctionne sur chaque élément de RDD dans un lot particulier et les résultats dans la RDD après l'application de la fonction transmise à la Carte.
OriginalL'auteur rahul gulati