Comment trouver tous les le texte à l'intérieur <p> éléments dans une page HTML à l'aide de BeautifulSoup

J'ai besoin de trouver toutes les balises à l'intérieur de l'alinéa éléments dans un fichier HTML à l'aide de BeautifulSoup en Python.

Par exemple,

<p>Many hundreds of named mango <a href="/wiki/Cultivar" title="Cultivar">cultivars</a> exist.</p>

doit retourner à:

Many hundreds of cultivars exist.

P. S. Certains fichiers contiennent des caractères Unicode (Hindi) qui doivent être extraites.

Toutes les idées de comment faire cela?

InformationsquelleAutor rarora7777 | 2012-04-11