Ce qui est une bonne regex pour inclure les caractères accentués d'une manière simple?
Droit maintenant, ma regex est quelque chose comme ceci:
[a-zA-Z0-9] mais il ne comprend pas les caractères accentués comme je voudrais. Je voudrais également comme - '.
Quelle langue ou le moteur d'expressions régulières êtes-vous d'utiliser les regex?
Qu'entendez-vous par les caractères accentués ?
Je suppose que c'est l'un de ceci: en.wikipedia.org/wiki/Ä
Qu'entendez-vous par les caractères accentués ?
Je suppose que c'est l'un de ceci: en.wikipedia.org/wiki/Ä
OriginalL'auteur Exn | 2014-07-10
Vous devez vous connecter pour publier un commentaire.
Caractères accentués: BRICOLAGE de la Gamme de Caractères Soustraction
Si votre moteur d'expressions régulières permet (et beaucoup), cela fonctionne:
Veuillez voir la démo (vous pouvez ajouter des caractères à tester).
Explication
(?i)
jeux de casse en mode^
d'ancrage affirme que nous sommes au début de la chaîne(?:(?![×Þß÷þø])[-'0-9a-zÀ-ÿ])
correspond à un personnage...(?![×Þß÷þø])
affirme que le char n'est pas un de ceux dans les crochets[-'0-9a-zÀ-ÿ]
permet tiret, apostrophe, des chiffres, des lettres et des caractères dans un large accentués gamme, à partir de laquelle nous devons soustraire+
matches en une ou plusieurs fois$
d'ancrage affirme que nous sommes à la fin de la chaîneRéférence
Table ASCII étendue
Ne devrait-elle pas être À-Ž?
OriginalL'auteur zx81
Utiliser une POSIX classe de personnage (http://www.regular-expressions.info/posixbrackets.html):
[-'[:alpha:]0-9]
ou[-'[:alnum:]]
La
[:alpha:]
classe de caractères correspond à ce qui est considéré comme "caractères alphabétiques" dans vos paramètres régionaux.OriginalL'auteur Brian Stephens
Une version sans les règles d'exclusion:
Explication
^
d'ancrage affirme que nous sommes au début de la chaîne[...]
permet tiret, apostrophe,des chiffres, des lettres et des caractères dans un large accentués gamme,
+
matches en une ou plusieurs fois$
d'ancrage affirme que nous sommes à la fin de la chaîneRéférence
Toutefois, elle permet de couvrir l'exigence de "bonne" couverture de la plupart des communes de caractères accentués et facilement modifiable à tout les lecteurs exigences. æ, æ, n, ō, ß et ø sont dans mon exigence. Grand outil de test!
OriginalL'auteur just.jules