Obtenir le texte des enfants dans un div avec beautifulsoup

Salut, je veux la description d'une Application dans le Google Playstore. (https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de)

import urllib2
from bs4 import BeautifulSoup

soup = BeautifulSoup(urllib2.urlopen("https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de"))
result = soup.find_all("div", {"class":"show-more-content text-body"})

Avec ce code j'obtiens l'ensemble du contenu dans cette classe. Mais je ne peux pas obtenir seulement le texte. J'ai essayé beaucoup de choses avec next_silbing ou .le texte, mais il jette toujours des erreurs(ResultSet n'a pas d'attribut xxx).

Je veux juste le texte comme suit: "Die Android App von wetter.com! Sie erhalten: ..:"

Quelqu'un peut m'aider?

OriginalL'auteur Si Mon | 2014-01-02

18

Utiliser le .text attribut sur les éléments, vous avez une liste résultats, de sorte que la boucle:
```
for res in result:
    print res.text
```
Sinon, si il n'est jamais censé être un tels <div>, utilisez .find() au lieu de .find_all():
```
result = soup.find("div", {"class":"show-more-content text-body"})
print result.text
```
Génial, fonctionne comme un charme. J'ai essayé aussi de cette façon, mais a une erreur dans ce prob. Je vous remercie monsieur.
cela peut-il être utilisé? résultat = la soupe.find("div", {"classe":"afficher plus de contenu de texte-corps"}).de texte ?
bien sûr.
toutefois, en stockant le résultat de soup.find() tout d'abord, il est plus facile de tester si il y avait une suite (if result is not None:).
merci 😉 na pas voulu construire un test pour cette petite question

OriginalL'auteur Martijn Pieters

Vous devez vous connecter pour publier un commentaire.