La recherche par le biais de la page web
Hé, je suis en train de travailler sur un projet de Python qui exige que je regarde à travers une page web. Je veux regarder à travers pour trouver un texte spécifique et si elle trouve le texte, puis il imprime quelque chose. Si non, il imprime un message d'erreur. J'ai déjà essayé avec différents modules tels que libxml, mais je ne peux pas savoir comment j'allais le faire.
Quelqu'un pourrait-il prêter un peu d'aide?
- Avez-vous de la recherche dans l'ensemble de la page web (y compris les balises HTML) ou dans le texte que vous pouvez voir lorsque vous visitez la page avec un navigateur?
Vous devez vous connecter pour publier un commentaire.
Vous pourriez faire quelque chose de simple comme:
lxml est génial: http://lxml.de/parsing.html
Je l'utilise régulièrement avec xpath pour l'extraction des données à partir de l'html.
L'autre option est http://www.crummy.com/software/BeautifulSoup/ qui est très bien aussi.