Regex ponctuation split [Python]
Quelqu'un peut m'aider un peu avec les regexs? J'ai actuellement ceci: re.split(" +", line.rstrip())
qui permet de séparer par des espaces.
Comment pourrais-je développer pour couvrir la ponctuation, trop?
source d'informationauteur dantdj
Vous devez vous connecter pour publier un commentaire.
Officiel de la documentation Python est un bon exemple de cela. Il sera partagée sur tous les caractères non alphanumériques (les espaces et la ponctuation). Littéralement \W est le caractère de classe pour tous les Non-caractères de Mot. Remarque: le trait de soulignement "_" est considéré comme un "mot" caractère et ne fera pas partie de la scission ici.
Voir https://docs.python.org/3/library/re.html pour plus d'exemples, la page de recherche pour "re.split"
À l'aide de
string.punctuation
et la classe de personnage:Juste au cas où, il me semble que vous pourriez être en train de faire une analyse simple qui pourrait être couverte par shlex, à partir de la documentation:
http://docs.python.org/2/library/shlex.html