Convertir </br> à la fin de ligne
Je suis en train d'extraire du texte à l'aide de BeautifulSoup
. Je suis en utilisant get_text()
la fonction de ce but.
Mon problème est que le texte contient </br>
balises et j'ai besoin de les convertir à la fin des lignes. comment puis-je faire cela?
Vous devez vous connecter pour publier un commentaire.
Une regex devrait faire l'affaire.
Espérons que cette aide!
Vous pouvez faire cela en utilisant la BeautifulSoup objet lui-même, ou tout élément de celui-ci:
soup.text
par la suite, de supprimer d'autres balises html, alors qu'actuellement accepté de répondre à n'offrent pas cette possibilité.br.replace_with("\n" + br.text)
. Cette balise est mal...Comme officiel doc dit:
L'ajout de Ian et dividebyzero post/commentaires, vous pouvez le faire efficacement filtre/remplacer de nombreux étiquettes en une seule fois: