Json convertit & dans un String \u0026
Je suis en train d'extraire du texte à partir d'un fichier pdf et de les écrire dans un fichier json. Lors de l'extraction des caractères unicode au format Json convertit tous les & \u0026. Par exemple, pour ma Chaîne ش
. (ce qui représente ش). Il s'imprime correctement sur une .fichier txt pour console etc. Mais lorsque j'essaie d'imprimer cette chaîne de caractères dans un fichier Json il montre \u0026#1588;
.
Je suis à l'aide de Java, et le code est
Gson gson = new Gson();
String json = gson.toJson(pdfDoc);
Remarque: pdfDoc
est un objet, qui contient tous les détails (la position, la couleur, la police, etc...) de caractères à l'intérieur du document PDF d'entrée. Je suis à l'aide de gson-2.2.1.jar
.
OriginalL'auteur Neeraj | 2012-10-03
Vous devez vous connecter pour publier un commentaire.
Qui est en fait valable (mais pas obligatoire) de codage. Tout caractère peut être codé à l'aide de l'échappement unicode en JSON et tout JSON valide l'analyse de la bibliothèque doit être en mesure d'interpréter ces échappe.
&
ne fait pas partie des personnages qui besoin codage (voir la définition destring
au json.org), mais il y a quelques JSON bibliothèques qui sont assez "agressif" dans leur encodage. Ce n'est généralement pas un problème, sauf si vous n'avez pas vraiment gérer l'résultant de JSON avec un conforme parser JSON.GsonBuilder.disableHtmlEscaping() aidera à vous désactivez cette fonctionnalité, si vous avez absolument besoin.
OriginalL'auteur Joachim Sauer