Expression régulière pour les caractères Japonais
Je suis en train de faire de l'internationalisation dans les jambes de suspension. Je veux écrire du code Javascript de validation, en Japonais et en anglais aux utilisateurs. Je sais expression régulière pour l'anglais, mais pas pour les utilisateurs Japonais. Est-il possible d'écrire une expression régulière, tant pour les utilisateurs qui valider sur la base de l'Unicode?
S'il vous plaît aider moi.
- veuillez supprimer les espaces à gauche sur votre paragraphe... c'interprété comme du code, semble laid
Vous devez vous connecter pour publier un commentaire.
Ce thread peut être vieux mais juste pensé que j'ajoute mes 2 cents. Ici est une expression régulière qui peut être utilisé pour correspondre à tous les anglais des caractères alphanumériques, Japonais katakana,hiragana,multibytes de caractères alphanumériques [hankaku et zenkaku],des tirets
Vous pouvez la modifier afin de l'adapter à vos besoins, mais notez que le "u" drapeau à la fin.
J'espère que cela aide!
ぁ-ん
àぁ-ゔ
, comme ゔ vient après ん.々〆〤
, unicode 3005, 3006, et 3024 respectivement. 3005 est probablement le plus important, car il est utilisé dans des mots comme 代々木 et 時々[一-龠ぁ-ゔァ-ヴーa-zA-Z0-9々〆〤]+
À condition que votre éditeur de texte et de programmation de la langue de support de l'Unicode, vous devriez être en mesure de saisir des caractères Japonais comme des chaînes de caractères littérales. Des choses comme
[A-X]
plages sera probablement traduit pas très bien en général.Ce genre de texte que vous essayez de valider?
Quelle est la langue la régulière experssions dans? Perl-compatible POSIX, ou quelque chose d'autre?
Aussi longtemps que vous enregistrez vos scripts dans le même jeu de caractères de votre page (par exemple, HTML et JavaScript sont en UTF-8, ou les deux, HTML et JavaScript sont Shift_JIS), vous devez être en mesure de traiter vos expressions régulières exactement la même comme vous le feriez avec l'anglais.