Obtenir la valeur de la durée de l'étiquette à l'aide de BeautifulSoup
J'ai un certain nombre de facebook groupes que je voudrais obtenir le nombre de membres de. Un exemple serait de ce groupe: https://www.facebook.com/groups/347805588637627/
J'ai regardé inspecter l'élément sur la page et il est stocké comme suit:
<span id="count_text">9,413 members</span>
J'essaie d'obtenir des "9.413 placements membres" de la page. J'ai essayé d'utiliser BeautifulSoup, mais ne peut pas s'en sortir.
Grâce
Edit:
from bs4 import BeautifulSoup
import requests
url = "https://www.facebook.com/groups/347805588637627/"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data, "html.parser")
span = soup.find("span", id="count_text")
print(span.text)
- imprimer le
data
et vous remarquerez qu'il y a pas une telle balise.
Vous devez vous connecter pour publier un commentaire.
Dans le cas où il n'y a plus d'une balise span dans la page:
soup.find()
n'est pas de trouver les résultats, de sorte que vous êtes d'appel.text
surNone
. Essayez de regarder la même page web dans le mode navigation privée de votre navigateur; l'élément que vous recherchez n'est pas affiché lorsqu'il n'est pas connecté.Vous pouvez utiliser le
text
attribut de l'analyse durée:Facebook utilise
javascrypt
pour empêcher les bots de grattage. Vous avez besoin d'utiliserselenium
pour extraire des données sur python.