Comment puis-je extraire uniquement du texte dans le sélecteur d'éraflure en python

J'ai ce code

   site = hxs.select("//h1[@class='state']")
   log.msg(str(site[0].extract()),level=log.ERROR)

La sortie est

 [scrapy] ERROR: <h1 class="state"><strong>
            1</strong>
            <span> job containing <strong>php</strong> in <strong>region</strong> paying  <strong>$30-40k per year</strong></span>
                </h1>

Est-il possible d'obtenir uniquement le texte, sans les balises html

source d'informationauteur user825904