Belle Soupe si la Classe “Contient” ou Regex?
Si mes noms de classe sont constamment différent de dire par exemple:
listing-col-line-3-11 dpt 41
listing-col-block-1-22 dpt 41
listing-col-line-4-13 CWK 12
Normalement je pourrais faire:
for EachPart in soup.find_all("div", {"class" : "ClassNamesHere"}):
print EachPart.get_text()
Il y a trop de noms de classe pour travailler avec ici donc, un tas de ces sommes.
Je sais que Python n'est pas un ".contient:" je voudrais l'utiliser normalement mais il a un "de". Si je n'ai pas été en mesure de travailler sur une façon de les intégrer.
Je l'espère, il y a un moyen de le faire avec les regex. Bien qu'encore une fois mon syntaxe de Python est vraiment me laisser de moi, j'ai essayé de variations sur:
regex = re.compile('.*listing-col-.*')
for EachPart in soup.find_all(regex):
Mais qui ne semble pas faire l'affaire.
OriginalL'auteur PoweredByCoffee | 2016-01-07
Vous devez vous connecter pour publier un commentaire.
BeautifulSoup prend en charge Les sélecteurs CSS qui vous permettent de sélectionner des éléments basés sur le contenu des attributs particuliers. Cela comprend le sélecteur
*=
pour contient.Le suivant sera de retour tous les
div
éléments avec unclass
attribut contenant le texte 'inscription-col-':OriginalL'auteur mfitzp
Yu pouvez essayer ceci:
OriginalL'auteur Walid Saad