Convertir le Tableau[(String,String)] type de RDD[(String,String)] type spark

Je suis nouvelle étincelle.

Voici mon code:

val Data = sc.parallelize(List(
      ("I", "India"), 
      ("U", "USA"), 
      ("W", "West"))) 

val DataArray = sc.broadcast(Data.collect)

val FinalData = DataArray.value

Ici FinalData est de Array[(String, String)] type.
Mais je veux données dans le formulaire de RDD[(String, String)] type.

Puis-je convertir des FinalData à RDD[(String, String)] type.

Plus De Détail:

Je veux rejoindre les Deux RDD, de Sorte à optimiser la condition de jointure(Pour le point de vue des performances)
Je suis de radiodiffusion petit RDD à tous cluster de sorte que les données de brassage sera de moins en moins.(Et indirectement la performance aurez amélioré)
Donc, pour tout cela, j'ai écrit quelque chose comme ceci:

//Big Data
val FirstRDD = sc.parallelize(List(****Data of first table****))

//Small Data
val SecondRDD = sc.parallelize(List(****Data of Second table****)) 

Donc sans hésiter je vais diffuser Petit jeu de Données(moyens SecondRDD)

val DataArray = sc.broadcast(SecondRDD.collect)

val FinalData = DataArray.value

//Ici, il va donner d'erreur que

val Join = FirstRDD.leftOuterJoin(FinalData)

Trouvé Tableau requis RDD

C'est pourquoi je suis à la recherche pour le Tableau de RDD de conversion.

InformationsquelleAutor Darshan | 2016-09-21