Python : Comment convertir le format markdown texte formaté texte
J'ai besoin de convertir des réductions de texte format de texte brut pour afficher le résumé de mon site web. Je veux le code en python.
- Pas de python, mais vous pourriez passer à pandoc:
pandoc --to=plain
laisse un peu de mise en page (en-tête revient notamment sur), mais pas beaucoup.
Vous devez vous connecter pour publier un commentaire.
Ce module vous aide à faire ce que vous décrivez:
http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module
Une fois que vous avez converti le markdown en HTML, vous pouvez utiliser un analyseur HTML à dépouiller le texte brut.
Votre code pourrait ressembler à quelque chose comme ceci:
Commenté et l'a supprimé parce que j'ai enfin crois que je vois le hic ici: Il peut être plus facile pour convertir vos markdown en HTML et de les supprimer HTML dans le texte. Je ne suis pas au courant de quoi que ce soit de supprimer démarque de texte effectivement, mais il y a beaucoup de code HTML en texte brut solutions.
Malgré le fait que c'est une très vieille question, je voudrais suggérer une solution je suis venu jusqu'à récemment. Cela ne l'utilise BeautifulSoup, ni a une surcharge de la conversion en html et en arrière.
La markdown module de classe de base Markdown a une propriété output_formats qui n'est pas configurable, mais sinon patchable comme presque rien en python est. Cette propriété est un dict cartographie format de sortie nom à une fonction de rendu. Par défaut, il y a deux formats de sortie, 'html' et 'xhtml' en conséquence. Avec un peu d'aide qu'elle peut avoir un texte en clair fonction de rendu qui est facile à écrire:
décocher fonction prend markdown en entrée et retourne tous les démarques caractères sont supprimés.