Obtenez de texte visible de la page
Comment puis-je obtenir le texte visible partie d'une page web avec selenium webdriver sans les balises HTML?
J'ai besoin de quelque chose d'équivalent à la fonction HtmlPage.asText() de l'interface htmlunit.
Il ne suffit pas de prendre le texte avec la fonction WebDriver.getSource et analyser avec jsoup, parce qu'il pourrait être à la page, les éléments cachés (par CSS externe) dont je ne suis pas intéressé à eux.
- Si vous utilisez firefox, vous pouvez prendre une capture d'écran. Si vous avez besoin d'avoir le texte en êtes-vous sûr que vous avez besoin tout ce qui est visible? Normalement quand je dois gratter quelque chose que je ne se soucient que de quelques éléments sur la page. Jetez aussi un oeil à stackoverflow.com/questions/2646195/...
Vous devez vous connecter pour publier un commentaire.
Faire
By.tagName("body")
(ou un autre sélecteur pour sélectionner l'élément de plus haut niveau), puis la mise àgetText()
sur cet élément sera de retour tout le texte visible.driver.findElement(By.selectorType("selector"))
selenium.googlecode.com/git/docs/api/java/org/openqa/selenium/...Je peux vous aider avec C# Sélénium.
En utilisant cela, vous pouvez sélectionner tout le texte sur la page et l'enregistrer dans un fichier texte à l'emplacement de votre choix.
Assurez-vous d'utiliser ce genre de choses:
Après avoir atteint la page d'essayer d'utiliser ce code.
Je ne suis pas sûr de ce que la langue que vous utilisez, mais en C# le IWebElement objet a une .Méthode de texte. Cette méthode montre tout le texte qui est affiché entre l'élément d'ouverture et de fermeture de balise.
Je voudrais créer un IWebElement à l'aide de XPath pour saisir l'ensemble de la page. En d'autres termes, vous êtes saisissant le corps de l'élément et en regardant le texte qu'il contient.
Si le code ci-dessus ne fonctionne pas pour le sélénium, utilisez ceci: