XPath dans R en utilisant le package XML

Je suis nouveau sur XPath, mais je peux voir comment elle est puissante. Je suis en train de regarder le code source de cette lien et veulent simplement extraire le contenu et le nom d'utilisateur à partir de deux morceaux de la page, qui par souci de simplicité, sont situés près du haut du code source.

content="[Archive] Simburgur Live
Flux [Hors ligne] Gears of War 3"

<div class="username">Simburgur</div>

Voici mon code dans R:

doc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")

qui renvoie

[[1]]
<meta name="description" content="[Archive]  Simburgur's Live Stream [Offline] Gears of War 3" />

Évidemment, dans cet exemple, tout ce que je veux est ce qui est à l'intérieur des citations de contenu= mais je suis coincé et ne peut pas sembler obtenir mon expression de retourner la chaîne que je veux.

Je le répète. Je suis nouveau sur XPath. 🙂

source d'informationauteur Btibert3

r xpath

9

Utilisation:
```
/*/head/meta[@name='description']/@content
```
Ce encore sélectionne un nœud d'attributmais il y a probablement un moyen facile dans votre PL pour obtenir la chaîne de valeur de l'attribut.

Afin d'obtenir la valeur de chaîne, utilisez:
```
string(/*/head/meta[@name='description']/@content)
```
Ne remarque: à l'Aide de la // abréviation peut entraîner très lent évaluation de l'expression XPath, car il peut causer un linéaire de la traversée de l'ensemble de (sous -) arbre.

Toujours éviter d'utiliser // si la structure du document XML est connu statiquement .
3

Vous êtes à proximité. Cela devrait le faire.
```
//head/meta[@name=\"description\"]/@content
```
Les crochets sont en contraignant le choix des balises meta-tags, mais vous avez encore de spécifier l'attribut que vous souhaitez.

Vous devez vous connecter pour publier un commentaire.