Comment obtenir des données à partir d'inspecter l'élément d'une page web à l'aide de Python
Je voudrais obtenir les données à partir d'inspecter l'élément à l'aide de Python. Je suis en mesure de télécharger le code source à l'aide de BeautifulSoup, mais maintenant j'ai besoin de le texte à partir d'inspecter l'élément d'une page web. Je serais vraiment reconnaissant si vous pouviez me conseiller comment le faire.
Edit:
Par inspecter l'élément que je veux dire, dans google chrome, cliquez à droite nous donne une option appelée " inspecter l'élément qui a le code relatives à chaque élément de cette page en particulier. J'aimerais de l'extrait de code/juste ses chaînes de texte.
Vous allez avoir à décrire ce que vous voulez faire beaucoup plus clairement. Qu'est ce qu'un "inspecter l'élément"? Veuillez donner un exemple de ce que vous voulez faire.
Il n'utilise pas de Python, mais chrome vous permet de
Est-il un autre moyen de le faire, car je vais devoir le faire pour de nombreuses pages. Aussi, Exemplaire au format HTML est-il que pour une seule ligne, comme par ma compréhension. @AndrewJohnson
pouvez-vous ne pas extraire de tout cela dans le code html que vous avez téléchargé?
Correct.
Il n'utilise pas de Python, mais chrome vous permet de
Copy as HTML
si vous cliquez-droit sur le bleu de la ligne sélectionnée dans l'éditeur.Est-il un autre moyen de le faire, car je vais devoir le faire pour de nombreuses pages. Aussi, Exemplaire au format HTML est-il que pour une seule ligne, comme par ma compréhension. @AndrewJohnson
pouvez-vous ne pas extraire de tout cela dans le code html que vous avez téléchargé?
Correct.
Copy as HTML
vous donne juste l'élément sélectionné à partir d'une page. Ci-dessous, je vais donner un simple web-racloir, qui vous donnerait le même résultat via python automatiquement.OriginalL'auteur user3783999 | 2014-07-30
Vous devez vous connecter pour publier un commentaire.
Si vous voulez récupérer automatiquement une page web à partir de Python dans une manière qui exécute le Javascript, vous devriez regarder en Sélénium. Il peut automatiquement un navigateur web (même une tête navigateur web tel que PhantomJS, de sorte que vous n'avez pas à avoir une fenêtre ouverte).
Afin d'obtenir le code HTML, vous aurez besoin d'évaluer un peu de javascript. Simple exemple de code, le modifier pour l'adapter à:
Note 1: Si vous voulez un élément spécifique ou des éléments, en fait, vous avez quelques options -- analyser le code HTML, Python, ou d'écrire plus de JavaScript spécifique qui renvoie ce que vous voulez.
Note 2: si vous avez réellement besoin d'informations spécifiques à partir de Chrome sont des outils qui n'est pas seulement HTML générées dynamiquement, vous aurez besoin d'un moyen d'accrocher en Chrome lui-même. Pas moyen de contourner cela.
OriginalL'auteur Jason S
Inspecter l'élément montre tout le HTML de la page qui est la même que l'extraction de l'html à l'aide de
urllib
faire quelque chose comme ceci
OriginalL'auteur Serial
Je voudrais mettre à jour la réponse de Jason S. je n'ai pas pu démarrer phantomjs sur OS X
Résolu en réponse ici en téléchargeant les exécutables
OriginalL'auteur Jakub
BeautifulSoup peut être utilisée pour analyser le document html, et d'en extraire tout ce que vous voulez. Il n'est pas conçu pour le téléchargement. Vous pouvez trouver les éléments que vous voulez par les class et id.
OriginalL'auteur flyingfoxlee