Comment faire pour supprimer les caractères non-alphanumériques?

J'ai besoin de supprimer tous les caractères d'une chaîne de caractères qui ne sont pas dans a-z A-Z 0-9 définir ou ne sont pas des espaces.

Quelqu'un aurait-il une fonction pour faire cela?

InformationsquelleAutor zuk1 | 2009-03-18

645

Sonne comme vous avez presque savais ce que tu voulais faire déjà, en gros, vous avez défini comme une regex.
```
preg_replace("/[^A-Za-z0-9 ]/", '', $string);
```
- zuk1: regexbuddy est d'une grande aide avec qui
- Voici un exemple si vous voulez inclure le trait d'union comme un permis de caractère. J'avais besoin de cela parce que j'avais besoin de sortir la bande de caractères non autorisés à partir d'un Moodle nom d'utilisateur, basé sur les adresses email: preg_replace("/[^a-z0-9_.@\-]/", ", $chaîne de caractères);
- Serait-ce de travailler exactement la même chose avec des apostrophes (simple quotes) autour de l'expression régulière, au lieu de guillemets (double quotes)? E. g: preg_replace('/[^A-Za-z0-9 ]/', '', $string);
- Nous voulons des explications à ce sujet 🙂 . Les gens viennent ici pour voir Pourquoi c'est la façon dont il est. Veuillez considérer Regex explication trop! Merci
- Une bien meilleure réponse est ci-dessous.
- Que faire si nous voulons garder accentued personnages?
- Personne n'aime les regex, Ils apprécier les résultats et de les utiliser, mais personne n'aime la syntaxe
InformationsquelleAutor Chad Birch
159

De caractères unicode, il est :
```
preg_replace("/[^[:alnum:][:space:]]/u", '', $string);
```
- Maintenant, c'est la vraie réponse! +1
- salut voondo , c'est quoi ce /ui chose.. comment vous appelez ça ? quelqu'un peut s'il vous plaît faire de moi un peu de lumière. Je vous remercie.
- u : unicode, j' : insensible à la casse
- Pour plus de précisions, on les appelle des drapeaux. Ils sont placés après la fermeture d'un séparateur (dans ce cas c'est "/", mais il pourrait être "~" ou "@" ou le caractère que vous souhaitez utiliser aussi longtemps que l'ouverture et la fermeture des délimiteurs sont les mêmes) et de modifier le comportement de l'expression.
- Btw, \w comprend \d et donc la \d est inutile. Aussi, c'est faux, car il permettra également de laisser les traits de soulignement dans la chaîne résultante (qui est également inclus dans \w).
- réponse édité, merci !
- Il y a encore une erreur dans ce, les classes de caractères doivent être terminées par ':]' la ligne correcte serait: preg_replace("/[^[:alnum:][:space:]]/ui", ", $string);
- corrigé, merci ! désolé pour les informations trompeuses...
- Est le i drapeau vraiment nécessaire ici depuis [:alnum:] couvre déjà les deux cas?
InformationsquelleAutor voondo
48

Expression régulière est votre réponse.
```
$str = preg_replace('/[^a-z\d ]/i', '', $str);
```
- La i est synonyme de casse.
- ^ moyens, ne commence pas avec.
- \d correspond à un chiffre.
- a-z correspond à tous les caractères entre a et z. En raison de la i paramètre que vous n'avez pas à spécifier a-z et A-Z.
- Après \d il y a un espace, de sorte que les espaces sont autorisés dans cette regex.
- Nous voulons des explications à ce sujet 🙂 . Les gens viennent ici pour voir Pourquoi c'est la façon dont il est. Veuillez considérer Regex explication trop! Le monde n'est pas assez avancé pour savoir ce que vous avez écrit là, sans explication. Merci
- Le i signifie pas sensible à la casse. ^ signifie, ne commence pas avec. \d correspond à un chiffre. a-z correspond à tous les caractères compris entre a et z. En raison de la je paramètre que vous n'avez pas à spécifier a-z et A-Z. Après \d il y a un espace, des espaces sont permet dans cette expression.
- Les gens ne pas de lire des commentaires comme réponse. Veuillez mettre à jour la réponse!
InformationsquelleAutor raspi
16

voici une très simple regex pour que:
```
\W|_
```
et utilisé comme vous le souhaitez (avec un avant / slash délimiteur).
```
preg_replace("/\W|_/", '', $string);
```
Tester ici avec cet outil génial qui explique ce que la regex est en train de faire:

http://www.regexr.com/
- Vous avez encore besoin de la /u drapeau contraire des caractères non-ascii sont également supprimés.
- Ce site web est incroyable. Bonne ressource!
- Neat mais serait également correspondre à des espaces et si c'est voulu, probablement pu le double de la performance par l'utilisation d'un de la classe de caractères et supplémentaires quantificateur pour un ou plusieurs [\W_]+
InformationsquelleAutor Alex Stephens
5
```
[\W_]+
```
```
$string = preg_replace("/[\W_]+/u", '', $string);
```
De sélectionner tous les pas de A-Z, a-z, 0-9 et de le supprimer.

Voir exemple ici: https://regexr.com/3h1rj
- qu'est-ce regex /[\W_]+/u signifie ?
- \W est l'inverse de \w qui sont des personnages A-Za-z0-9_. Donc \W correspond à tout caractère qui n'est pas A-Za-z0-9_ et les supprimer. Le [] est un jeu de caractères limite. Le+ est redondante sur un jeu de caractères limite, mais normalement 1 ou plus de caractère. Le u drapeau développe l'expression d'inclure des caractères unicode à l'appui, le sens qu'il ne va pas supprimer des caractères au-delà de code de caractère 255 comme ª²³µ . Exemple de différents usages 3v4l.org/hSVV5 avec unicode et des caractères ascii.
InformationsquelleAutor Intacto
4

Si vous avez besoin de l'appui d'autres langues, au lieu de A-Z, vous pouvez utiliser les éléments suivants:
```
preg_replace('/[^\p{L}\p{N} ]+/', '', $string);
```
- [^\p{L}\p{N} ] définit un niée (Elle correspond à un caractère qui est pas défini) la classe de caractères:
  - \p{L}: une lettre de tout langue.
  - \p{N}: un caractère numérique dans tout script.
  - : un caractère d'espace.
- + goulûment correspond à la classe de personnage entre 1 et illimité fois.
Ce sera de préserver les lettres et les chiffres à partir d'autres langues et d'écritures ainsi que A-Z:
```
preg_replace('/[^\p{L}\p{N} ]+/', '', 'hello-world'); //helloworld
preg_replace('/[^\p{L}\p{N} ]+/', '', 'abc@~#123-+=öäå'); //abc123öäå
preg_replace('/[^\p{L}\p{N} ]+/', '', '你好世界!@£$%^&*()'); //你好世界
```
^{Remarque: C'est une très vieille mais pertinente question. Je réponds uniquement à fournir des renseignements supplémentaires qui peuvent être utiles pour les futurs visiteurs.}

InformationsquelleAutor Jonathon
2
```
preg_replace("/\W+/", '', $string)
```
Vous pouvez le tester ici : http://regexr.com/
- Par @Alex Stevens réponse, cela ne veut pas attraper des traits de soulignement "_".
InformationsquelleAutor DOZ
0

Je cherchais la réponse trop et mon intention était de nettoyer tous les non-alpha et il ne devrait pas avoir plus d'un espace.

Donc, j'ai modifié Alex en réponse à cela, et c'est de travailler pour moi
preg_replace('/[^a-z|\s+]+/i', ' ', $name)

L'expression régulière ci-dessus tourné sy8ed sirajul7_islam à sy ed sirajul islam

Explication: la regex va vérifier PAS TOUT de a à z dans le cas insensible façon ou plusieurs espaces blancs, et il sera converti en un espace unique.

InformationsquelleAutor ssi-anik
-8

j'utilise ceci:
```
//to remove non english character
$str = preg_replace('/[^//to remove non english character
$str = preg_replace('/[^\00-\255]+/u', '', $str);
-5]+/u', '', $str);
```
- C'est toutes sortes de mal. Il ne fait rien comme vous pensez qu'il est en train de faire. Ceux-ci sont octal. Octal 255 est vraiment 173 décimal ou 0xAD hex. Ce que vous avez écrit est équivalent à [^\x00-\xAD] où 0xAD est le point de code pour SOFT TIRET. Même si vous faites ce droit, [^\x00-\xFF] est complètement absurde et faux.
- Bien que le code soit apprécié, il devrait toujours être accompagnées d'une explication. Cela n'a pas à être long, mais c'est prévu.
InformationsquelleAutor Hoàng Vũ Tgtt

Vous devez vous connecter pour publier un commentaire.