Pourquoi est l'espace insécable pas un caractère d'espacement en java?

Alors que la recherche d'une bonne façon de découper l'espace insécable de analysée HTML, j'ai d'abord tombé sur java spartiate définition de String.trim() qui est au moins bien documentée. Je voulais éviter explicitement liste de caractères éligibles pour la coupe, j'ai donc supposé que l'utilisation de l'Unicode adossés à des méthodes sur le Caractère de classe pour faire le travail pour moi.

C'est quand j'ai découvert que Caractère.isWhitespace(char) exclut explicitement les espaces insécables:

C'est un espace Unicode caractère (SPACE_SEPARATOR, LINE_SEPARATOR, ou PARAGRAPH_SEPARATOR) mais n'est pas un espace de non-rupture ('\u00A0', '\u2007', '\u202F').

Pourquoi est-ce?

La mise en œuvre de correspondant .NET équivalent est moins discriminant.

InformationsquelleAutor Palimondo | 2009-06-29