Comment supprimer des caractères spéciaux spécifiques dans R
J'ai quelques phrases comme celle-ci.
c = "In Acid-base reaction (page[4]), why does it create water and not H+?"
Je veux enlever tous les caractères spéciaux à l'exception '?&+-/
Je sais que si je veux enlever tous les caractères spéciaux, je peux simplement utiliser
gsub("[[:punct:]]", "", c)
"In Acidbase reaction page4 why does it create water and not H"
Cependant, certains caractères spéciaux comme + - ? sont également supprimés, dont j'ai l'intention de garder.
J'ai essayé de créer une chaîne de caractères spéciaux que je peux utiliser dans un code comme ceci
gsub("[special_string]", "", c)
Le mieux que je puisse faire est de venir avec ce
cat("!\"#$%()*,.:;<=>@[\\]^_`{|}~.")
Cependant, le code suivant ne fonctionnera pas
gsub("[cat("!\"#$%()*,.:;<=>@[\\]^_`{|}~.")]", "", c)
Que dois-je faire pour supprimer les caractères spéciaux, à l'exception de quelques que je veux garder?
Grâce
source d'informationauteur wen
Vous devez vous connecter pour publier un commentaire.
Je pense que vous êtes après une regex solution. Je vais vous donner un désordre solution et un forfait ajouter sur la solution (sans vergogne l'auto-promotion).
Il y a probablement une meilleure regex:
Afin d'obtenir votre méthode de travail, vous avez besoin de mettre le caractère "]" immédiatement après le premier "["
Vous pouvez mettre à l'intérieur "[" n'importe où. Si vous avez besoin d'exclure moins, il doit être le dernier. Voir l' ?regex page après tous ces pré-défini les classes de caractères sont répertoriés.