Obtenez de texte visible de la page

Comment puis-je obtenir le texte visible partie d'une page web avec selenium webdriver sans les balises HTML?

J'ai besoin de quelque chose d'équivalent à la fonction HtmlPage.asText() de l'interface htmlunit.

Il ne suffit pas de prendre le texte avec la fonction WebDriver.getSource et analyser avec jsoup, parce qu'il pourrait être à la page, les éléments cachés (par CSS externe) dont je ne suis pas intéressé à eux.

Si vous utilisez firefox, vous pouvez prendre une capture d'écran. Si vous avez besoin d'avoir le texte en êtes-vous sûr que vous avez besoin tout ce qui est visible? Normalement quand je dois gratter quelque chose que je ne se soucient que de quelques éléments sur la page. Jetez aussi un oeil à stackoverflow.com/questions/2646195/...

InformationsquelleAutor David Michael Gang | 2013-08-20

java selenium-webdriver

36

Faire By.tagName("body") (ou un autre sélecteur pour sélectionner l'élément de plus haut niveau), puis la mise à getText() sur cet élément sera de retour tout le texte visible.
- De quel type d'objet est "De"?
- C'est ainsi que le Sélénium les sépare de leurs sélecteurs. driver.findElement(By.selectorType("selector")) selenium.googlecode.com/git/docs/api/java/org/openqa/selenium/...
- Oh, j'ai tout compris. Je suis Python et c'est la syntaxe Java. Merci!
- En python, les getText() la méthode n'existe pas. Au lieu de cela, nous devrions utiliser l'élément.texte
InformationsquelleAutor Nathan Merrill
11

Je peux vous aider avec C# Sélénium.

En utilisant cela, vous pouvez sélectionner tout le texte sur la page et l'enregistrer dans un fichier texte à l'emplacement de votre choix.

Assurez-vous d'utiliser ce genre de choses:
```
using System.IO;
using System.Text;
using OpenQA.Selenium;
using OpenQA.Selenium.Support.UI;
```
Après avoir atteint la page d'essayer d'utiliser ce code.
```
IWebElement body = driver.FindElement(By.TagName("body"));
var result = driver.FindElement(By.TagName("body")).Text;

//Folder location
var dir = @"C:Textfile" + DateTime.Now.ToShortDateString();

//If the folder doesn't exist, create it
if (!Directory.Exists(dir))
Directory.CreateDirectory(dir);

//Creates a file copiedtext.txt with all the contents on the page.
File.AppendAllText(Path.Combine(dir, "Copiedtext.txt"), result);
```
- L'homme, les gens sont méchants. Pourquoi était-ce downvoted? Causer à la personne qui a répondu a ajouté un lil' code supplémentaire pour enregistrer ce qui a été capturé à un fichier de texte? On a tous le même code qu'à ceux qui ont répondu ci-dessus.
InformationsquelleAutor Anuraj S.L
6

Je ne suis pas sûr de ce que la langue que vous utilisez, mais en C# le IWebElement objet a une .Méthode de texte. Cette méthode montre tout le texte qui est affiché entre l'élément d'ouverture et de fermeture de balise.

Je voudrais créer un IWebElement à l'aide de XPath pour saisir l'ensemble de la page. En d'autres termes, vous êtes saisissant le corps de l'élément et en regardant le texte qu'il contient.
```
string pageText = driver.FindElement(By.XPath("//html/body/")).Text;
```
Si le code ci-dessus ne fonctionne pas pour le sélénium, utilisez ceci:
```
string yourtext= driver.findElement(By.tagName("body")).getText();
```
- Je l'ai résolu avec la commande du pilote.findElement(Par.tagName("corps")).getText()
- parfait. Qui semble être la java équivalent à la C# code ci-dessus. La clé est de saisir le corps n'est pas une balise html pour plus d'efficacité. J'ai tendance à utiliser XPath en raison de combien il est facile d'obtenir xpath dans Chrome, mais vous pouvez utiliser Par.cssSelector("corps") ou le Par.tagName("corps") que vous avez utilisé. Ils ont tous sélectionner le même élément.
InformationsquelleAutor Brantley Blanchard

Vous devez vous connecter pour publier un commentaire.