Liste de tous unicode de l'ouverture/fermeture des crochets?
Ce qui est une liste de tous les unicode support-comme les personnages (y compris, par exemple: {}[]()<>
)? Ce qui est un bon moyen pour rechercher des caractères unicode?
OriginalL'auteur MaiaVictor | 2012-11-23
Vous devez vous connecter pour publier un commentaire.
Il y a un texte brut de la base de données des informations sur chaque caractère Unicode disponibles à partir de l'Unicode Consortium; le format est décrit dans Unicode Annexe N ° 44. La principale information est contenue dans UnicodeData.txt. Ouvrir et fermer les caractères de ponctuation sont indiqués avec
Ps
(ponctuation) etPe
(signes de ponctuation à la fin) dans le General_Category champ (le troisième champ délimité par l';
). Recherchez ces caractères, et vous trouverez ce que vous cherchez.Noter que pas tous les caractères que vous considérez comme des parenthèses peut être inscrit; par exemple, les guillemets (y compris les "«»"). sont indiqués avec
Pi
etPf
(initiale et finale de la ponctuation), de sorte que vous pouvez inclure ceux aussi bien. Et un certain caractère, comme<
et>
, sont utilisés comme supports dans certains contextes (par exemple HTML/XML), alors qu'ils sont considérés comme des symboles mathématiques (Sm
) UnicodeData.txt. Ceux que vous allez avoir à trouver de la main; il n'est pas pré-déterminé de référencement de celui-ci.Voici un petit script Bash pour obtenir cette information, et sa sortie. J'ai inclus à la fois les parenthèses et les guillemets. (note: il ressemble à Bash de l'UTF-8 a l'impression d'un bogue qui a fait ne pas imprimer U+00AB "«" et U+00BB "»" correctement, c'est pourquoi les montrer ?).
Pour la facilité d'utilisation, j'ai mis cette liste comme un résumé.
Merci! Pendant que vous y êtes, vous devriez assurez-vous de régler le problème que j'ai indiqué où Bash eu des ennuis avec U+00AB "«" et U+00BB "»". Je n'ai pas pris la peine de modifier manuellement la liste parce que j'étais juste l'utilisation de ce comme un exemple de l'analyse de la liste, mais si vous allez à présent une liste distincte, vous devez probablement le fixer.
Probablement, vous voulez également inclure des choses comme ⋘ (BEAUCOUP MOINS), qui est classée dans la catégorie Sm (Symbole, Mathématiques). Et ⚟ TROIS LIGNES CONVERGENTES GAUCHE.
Le texte brut de la base de données a maintenant deux fichiers répertoriant tous en miroir des personnages: BidiBrackets.txt et un BidiMirroring.txt. L'un d'eux les listes de crochets seulement, alors que l'on recense également d'autres personnages comme le ≤ et ≥.
OriginalL'auteur Brian Campbell
Il n'y a pas de liste canonique de cette Unicode—vous devrez définir votre propre liste. Vous pourriez commencer par l'utilisation de Python est
unicodedata
module d'explorer l'Unicode base de données. Notez que ce ne sera pas trouver des choses comme<>
qui sont utilisés comme des accolades, même si ils ont d'autres officiels de significations, à savoir inférieur à et supérieur à signes.De sortie:
OriginalL'auteur andrewdotn
Dernières versions Unicode ont ajouté une propriété Bidi_Paired_Bracket, qui donne ce que l'Unicode pense que c'est la réponse à cette question. Ceci est différent de ceux qui sont en miroir. Il y a 60 support de paires comme de l'Unicode 8.0. Le tableau suivant cartes chacun à son compagnon. La première colonne donne un point de code; la seconde donne la version Unicode, il a été introduit dans, la troisième montre la correspondance, et la dernière colonne donne le mappage par le nom d'un personnage. Aussi, pour la recherche à la base de données des caractères Unicode, Perl5 est fourni avec le module Unicode::UCD, avec de nombreuses fonctions pour l'inspection de choses, y compris les nouvelles qui en Perl v5.22 qui affichera la valeur de toutes les propriétés d'un point de code. Unicode::bras de fer sur le CPAN des offres similaires et d'autres fonctionnalités
OriginalL'auteur khw
Si vous voulez ramasser des personnages comme
<
et>
qui ne sont pas officiellement considérés comme des symboles de groupement, vous pouvez prendre un coup d'oeil à http://www.unicode.org/Public/UNIDATA/BidiMirroring.txt comme suggéré par @roeland ici. Ce fichier répertorie toutes les paires de caractères qui doivent être des images en miroir les uns des autres.Voici la liste complète:
OriginalL'auteur kuzzooroo
L'idée de “support” comme de caractères peut être plus ou moins être identifié avec la Catégorie Générale (gc) les valeurs de propriété de Ps (signes de Ponctuation, ouverte) et Pe (signes de Ponctuation, à proximité). Cette catégorie contient quelques dizaines de paires de signes de ponctuation, surtout à l'exclusion des guillemets (catégories de Pi et Pf).
Dans la programmation, de nombreuses langues ont des outils de test pour la Catégorie Générale d'un caractère, par exemple,
\p{Ps}
en Perl.Si vous avez juste besoin de certaines listes, vous pouvez utiliser le Catégories De Caractères Unicode de l'information à fileformat.info.
Généralement, la manière de rechercher les caractères Unicode dépend de ce que vous recherchez et vos critères. Catégorie générale est un bon point de départ dans de nombreux cas.
Génie lien!!!
OriginalL'auteur Jukka K. Korpela
Ce - évidemment - dépend exactement ce que vous comptez faire. J'ai créer le site web http://write-math.com. Au cours de mes études de baccalauréat thèse, j'ai créé un symbole classificateur (qui est maintenant sur ce site web, sous "classer") qui donne aux utilisateurs la possibilité de dessiner un symbole et obtenir le LaTeX /unicode résultat (actuellement seulement 369 symboles sont pris en charge). C'est très bien si vous souhaitez mettre en page un document et de recherche unique, des caractères spécifiques de qui vous savez comment ils ressemblent /comment ils sont appelés, mais pas comment les écrire avec du LaTeX (ou ce que vous utilisez pour la composition):
Il dispose également d'un symbole de fonction de recherche. C'est encore en développement, mais il y a 1166 symboles dans cette base de données.
Pour vos supports:
unicode.xml
(à partir de http://www.w3.org/2003/entities/2007doc/#source) est également vaut le coup d'essayer.OriginalL'auteur Martin Thoma
http://xahlee.info/comp/unicode_matching_brackets.html
C'est un excellent et très complet site internet (par crochets et tout le reste aussi), et on dirait qu'ils l'affichage à l'aide d'Arial, sans-serif, donc si vous pouvez voir le personnage, alors il devrait fonctionner avec une bonne prise en charge du navigateur.
OriginalL'auteur Dovev Hefetz