Obtenir le texte des enfants dans un div avec beautifulsoup
Salut, je veux la description d'une Application dans le Google Playstore. (https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de)
import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen("https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de"))
result = soup.find_all("div", {"class":"show-more-content text-body"})
Avec ce code j'obtiens l'ensemble du contenu dans cette classe. Mais je ne peux pas obtenir seulement le texte. J'ai essayé beaucoup de choses avec next_silbing ou .le texte, mais il jette toujours des erreurs(ResultSet n'a pas d'attribut xxx).
Je veux juste le texte comme suit: "Die Android App von wetter.com! Sie erhalten: ..:"
Quelqu'un peut m'aider?
OriginalL'auteur Si Mon | 2014-01-02
Vous devez vous connecter pour publier un commentaire.
Utiliser le
.text
attribut sur les éléments, vous avez une liste résultats, de sorte que la boucle:Sinon, si il n'est jamais censé être un tels
<div>
, utilisez.find()
au lieu de.find_all()
:cela peut-il être utilisé? résultat = la soupe.find("div", {"classe":"afficher plus de contenu de texte-corps"}).de texte ?
bien sûr.
toutefois, en stockant le résultat de
soup.find()
tout d'abord, il est plus facile de tester si il y avait une suite (if result is not None:
).merci 😉 na pas voulu construire un test pour cette petite question
OriginalL'auteur Martijn Pieters