python: le nettoyage d'une chaîne
j'ai une chaîne comme celle-ci
somestring='in this/string /i have many. interesting.occurrences of {different chars} that need to .be removed '
voici le résultat que je veux:
somestring='in this string i have many interesting occurrences of different chars that need to be removed'
j'ai commencé à faire manuellement toutes sortes de .replace
, mais il y a tellement de combinaisons différentes qui, je pense, il doit y avoir un moyen plus simple. peut-être il y a une bibliothèque qui fait déjà cela?
personne ne sait comment je peux nettoyer ce string>?
Vous devez vous connecter pour publier un commentaire.
Je voudrais utiliser une expression régulière pour remplacer tous les non-alphanumériques, espaces:
Vous avez deux étapes: la suppression de la ponctuation, puis supprimer les espaces.
1) Utiliser des chaînes de caractères.traduire
Cela rend applique ensuite une table de traduction des cartes caractères de ponctuation à l'espace.
2) Supprimer les espaces en trop
interesting.occurrences
doit devenirinteresting occurrences
avec un espace.'need to'
condensée en un'need to'