Beautifulsoup = extraire le contenu dans une balise
Je voudrais extraire le contenu "Hello world". Veuillez noter qu'il y a de multiples <table>
et similaires <td colspan="2">
sur la page.
j'ai essayé le suivant:
hello = soup.find(text='Name: ')
hello.findPreviousSiblings
Mais il n'a rien retourné.
Voici l'extrait du code:
<table border="0" cellspacing="2" width="800">
<tr>
<td colspan="2"><b>Name: </b>Hello world</td>
</tr>
<tr>
En outre, je suis aussi d'avoir un problème avec la suite de l'extraction de l' "Mon domicile":
<td><b>Address:</b></td>
<td>My home address</td>
Je suis également en utilisant la même méthode pour rechercher du texte="Adresse:" mais comment puis-je naviguer vers la ligne suivante et d'en extraire le contenu de <td>
?
OriginalL'auteur ready | 2011-05-14
Vous devez vous connecter pour publier un commentaire.
La
contents
opérateur fonctionne bien pour l'extraction detext
de<tag>text</tag>
.<td>My home address</td>
exemple:<td><b>Address:</b></td>
exemple:OriginalL'auteur solvingPuzzles
utiliser la prochaine au lieu
prochaine et précédente vous permettent de vous déplacer dans le document les éléments dans l'ordre où elles ont été traitées par l'analyseur de tout, de frère, de méthodes de travail avec l'arbre d'analyse
n' 'Nom:' apparaît nulle part ailleurs dans le document?
Désolé, c'était mon erreur plus tôt. Maintenant, il fonctionne.
Désolé pour les multiples commentaires que je ne connaissais pas la touche de retour en fait a posté le commentaire. Je pensais que si il y a une meilleure méthode pour ce faire, juste au cas où si il y a un texte similaire qui est "Nom: ".
vous pouvez vérifier pour bonjour.parent.parent.nom ou bonjour.parent.parent.attrs ou autre chose que vous pouvez accrocher à
OriginalL'auteur Dragan Chupacabric