Comment faire pour lire tout le fichier dans une chaîne

Je veux lire json ou xml fichier dans pyspark.lf mon fichier est divisé en plusieurs ligne dans

rdd= sc.textFIle(json or xml) 

Entrée

{
" employees":
[
 {
 "firstName":"John",
 "lastName":"Doe" 
},
 { 
"firstName":"Anna"
  ]
}

D'entrée est réparti sur plusieurs lignes.

Sortie Attendue {"employees:[{"firstName:"John",......]}

Comment obtenir le dossier complet en une seule ligne à l'aide de pyspark?

S'il vous plaît aidez-moi je suis nouveau à l'étincelle.

l'espace n'a pas d'importance, vraiment, il est là uniquement pour des fins d'affichage. json avec des sauts de ligne/indentation est encore json...
Comment faire pour ajouter tous penser une seule chaîne
Comment faire pour ajouter pense que dans une seule ligne(string), en supprimant les espaces
Voulez-vous l'ensemble de la RDD dans une chaîne ou voulez-vous vous voulez que tout d'un seul disque?
Je veux que vous souhaitez tout d'un seul enregistrement

OriginalL'auteur Kumar | 2015-05-25