BS4: Arriver texte contenu dans la balise
Je suis en utilisant belle soupe. Il existe une balise comme ceci:
<li><a href="example"> s.r.o., <small>small</small></a></li>
Je veux faire passer le texte à l'intérieur de l'ancre <a>
l'étiquette, sans à partir de la <small>
dans la balise de sortie; c'est à dire " s.r.o.,
"
J'ai essayé find('li').text[0]
mais il ne fonctionne pas.
Est-il une commande dans BS4 qui peut le faire?
Grâce
Vous devez vous connecter pour publier un commentaire.
Une option pourrait être d'obtenir le premier élément de la
contenu
de laa
élément:Une autre serait de trouver le
small
tag et obtenir le frère précédent:Bien, il y a toutes sortes d'alternatives/fou options:
Utilisation .les enfants
Si vous souhaitez boucle pour imprimer tout le contenu de l'ancre de balises situé dans la chaîne html/page web (vous devez utiliser urlopen de urllib), cela fonctionne:
De sortie:
a_tag
est une liste contenant tous les tags ancres; la collecte de toutes les balises d'ancrage dans une liste, permet au groupe d'édition (si plus d'un<a>
tags présents.