Comment obtenir le source html d'un élément spécifique du sélénium?

La page que je suis à la recherche d'contient :

<div id='1'> <p> text 1 <h1> text 2 </h1> text 3 <p> text 4 </p> </p> </div>

Je veux obtenir tout le texte dans le div, sauf pour le texte qui est dans le <h>.
(Je veux recevoir un "texte 1","texte 3" et "texte 4")
Il peut y avoir un peu de <h> éléments, ou rien du tout.
Et il peut y avoir quelques <p> éléments, même à l'intérieur de l'autre, ou aucun.

J'ai pensé à faire cela en faisant le source html de la div, et à l'aide d'une regex pour supprimer le <h> éléments. Mais le sélénium.get_text ne retourne pas le html, juste le texte (tout ça!).

Je sais que je peux utiliser selenium.get_html_source puis recherchez l'élément que j'ai besoin avec une regex, mais qui ressemble à des déchets depuis le sélénium sait comment trouver l'élément.

Quelqu'un aurait-il une meilleure solution?
Merci 🙂

OriginalL'auteur Rivka | 2009-11-29