Imprimer littéral de chaîne unicode comme le caractère réel

Dans mon application Java j'ai été dépassé dans une chaîne qui ressemble à ceci:

"\u00a5123"

Lors de l'impression de cette chaîne dans la console, j'obtiens la même chaîne que la sortie (comme prévu).

Cependant, je veux imprimer en avoir l'unicode converti dans le symbole du yen (\u00a5 -> symbole du yen) - comment pourrais-je aller sur le faire?

c'est à dire si il ressemble à ceci: "[symbole du yen]123"

Donc, pour peut-être obtenir une meilleure idée de l'espace du problème, il n'y a pas moyen d'obtenir une bonne Chaîne unicode? Ce contexte est-ce utilisé? Est temps/vitesse d'une considération importante?
Aussi, existe-il des hypothèses de simplification? c'est à dire est-ce la seule fois qu'un "\u####" va se produire? Parce que vous pouvez utiliser une expression régulière pour sortir le nombre.
double possible de Howto ne pas encoder un Java littéral de chaîne en Java
Cela est nécessaire lors de l'exécution d'un programme java via groovy, où il interprète $ différemment. J'ai donc utiliser System.out.println("\u0024");

OriginalL'auteur digiarnie | 2009-09-10

java unicode

16

J'ai écrit un petit programme:
```
public static void main(String[] args) {
    System.out.println("\u00a5123");
}
```
Elle est sortie:

¥123

c'est à dire la sortie de exactement ce que vous avez dit dans votre post. Je ne suis pas sûr qu'il n'est pas quelque chose d'autre se passe. Quelle est la version de Java que vous utilisez?

edit:

En réponse à vos éclaircissements, il ya un couple de techniques différentes. Le plus simple est de regarder pour un "\u" suivie par 4 code hexadécimal des personnages, de l'extrait de la pièce et de la remplacer par une version unicode avec l'hexadécimal (à l'aide de la classe de Caractères). Cela suppose bien sûr que la chaîne n'aura pas \u en face d'elle.

Je ne suis pas au courant de tout système particulier pour analyser la Chaîne, comme si c'était une codé en Java String.

Vous avez raison de dire que l'impression de la chaîne directement vous donnera le bon de sortie. Cependant, quelqu'un m'a passé une chaîne de caractères qui est essentiellement échappé. Supposons donc votre principal moyen existe toujours, mais vous avez appelé une méthode appelée foo comme suit: foo("\\u00a5123"); <-- note l'échappement de la chaîne - donc, essentiellement, le paramètre-je obtenir à l'intérieur de la méthode foo est la chaîne que je fais affaire avec
Barre oblique inverse s'échapper est quelque chose que seul le compilateur Java doit traiter avec, pas la JVM ou de l'API. Il n'est donc pas surprenant de constater qu'il n'y a pas un moyen facile d'analyser ces chaînes au moment de l'exécution.
convenu, sur la seule chose que j'ai pu penser il est tentant d'utiliser le compilateur d'une certaine façon, mais qui semble être une difficulté pour moi.

OriginalL'auteur aperkins
2

Comme il a été mentionné avant, ces chaînes doivent être analysées pour obtenir le résultat souhaité.
1. Marquer la chaîne à l'aide de \u comme séparateur. Par exemple: \u63A5\u53D7 => { "63A5", "53D7" }
2. Processus de ces chaînes comme suit:
```
String hex = "63A5";
int intValue = Integer.parseInt(hex, 16);
System.out.println((char)intValue);
```
OriginalL'auteur Abhinav Maheshwari
1

Vous allez probablement avoir à écrire un parser pour ceux-ci, sauf si vous pouvez en trouver un dans une librairie tierce. Il n'y a rien dans le JDK pour analyser ces pour vous, je le sais parce que j'ai assez récemment eu l'idée d'utiliser ce genre d'évasions, comme un moyen pour la contrebande d'unicode par le biais d'un Latin-1 seule base de données. (J'ai fini par faire quelque chose d'autre d'ailleurs)

Je vais vous dire que java.util.Propriétés échappe et unescapes des caractères Unicode dans cette manière lors de la lecture et de l'écriture de fichiers (puisque les fichiers doivent être au format ASCII). Les méthodes qu'il utilise pour ce sont privés, donc vous ne pouvez pas les appeler, mais vous pouvez utiliser le JDK code source pour inspirer votre solution.

Un peu compliqué, mais vous pourriez probablement émettent de la chaîne de valeur à un en mémoire les propriétés de fichier, puis de le lire en utilisant le Properties classe.

OriginalL'auteur Licky Lindsay

Pourrait remplacer le ci-dessus:

System.out.println((char)0x63A5);

Voici le code pour imprimer la totalité de la zone de construction de caractères unicode.

public static void printBox()
{
    for (int i=0x2500;i<=0x257F;i++)
    {
        System.out.printf("0x%x : %c\n",i,(char)i);
    }
}

OriginalL'auteur Joel Swanson

Vous devez vous connecter pour publier un commentaire.