python xml de requête get parent

J'ai un gros document xml qui ressemble à ceci:

<Node name="foo">
    <Node name="16764764625">
        <Val name="type"><s>3</s></Val>
        <Val name="owner"><s>1</s></Val>
        <Val name="location"><s>4</s></Val>
        <Val name="brb"><n/></Val>
        <Val name="number"><f>24856</f></Val>
        <Val name="number2"><f>97000.0</f></Val>
    </Node>
    <Node name="1764466544">
        <Val name="type"><s>1</s></Val>
        <Val name="owner"><s>2</s></Val>
        <Val name="location"><s>6</s></Val>
        <Val name="brb"><n/></Val>
        <Val name="number"><f>265456</f></Val>
        <Val name="number2"><f>99000.0</f></Val>
    </Node>
    ...
</Node>

Ma mission est de récupérer la valeur du nœud parent: 1764466544 (valeur de nom en 2ème Nœud) en faisant une recherche pour trouver si le sous-élément du nœud Val name="nombre" contient 265456

J'ai fait un tas de lecture sur XPath, et ElementTree, mais je ne sais pas encore par où commencer en fait cette requête. Vous cherchez des exemples... je ne trouve pas qui font référence à un nœud parent comme un résultat.

Encore python.. toutes les suggestions seraient appréciées.

Grâce

InformationsquelleAutor itwb | 2011-03-21

3

Ce XPath:
```
/Node/Node[Val[@name='number']/f='265456']/@name
```
Sorties:
```
1764466544
```
- Je n'ai jamais essayé de XPath en Python, de sorte que la pièce est à vous, mais le XPath travaux ci-dessus dans l'abstrait. Testez ici, par exemple: xmlme.com/XpathTool.aspx
- Ouais, merci pour ça. Maintenant j'ai cette erreur: SyntaxError: impossible d'utiliser le chemin absolu sur l'élément.
- Je suis en territoire inconnu ici, mais ce lien montre le code suivant pour les expressions XPath avec l'un des principaux /: raise SyntaxError("cannot use absolute path on element"). Peut-être essayer un de l'expression par rapport? Cette Node/Node[Val[@name='number']/f='265456']/@name ou ce //Node/Node[Val[@name='number']/f='265456']/@name
- Cela est correct. L'utilisation d'un standard se plaindre de la bibliothèque comme lxml.de
- +1 expression Correcte.
InformationsquelleAutor Wayne Burkett
4

Malheureusement, lors de l'utilisation de la ElementTree API, chaque Element objet n'a pas de référence à son parent, de sorte que vous ne peut pas aller en haut de l'arborescence à partir d'un point connu. Au lieu de cela, vous devez trouver le parent possible des objets et filtre à ceux que vous voulez.

C'est généralement le cas avec les expressions XPath. Cependant, ElementTree prend uniquement en charge un sous-ensemble de XPath (voir les docs), la plupart des éléments utiles qui ont été ajoutées dans ElementTree 1.3, qui vient seulement avec Python 2.7+ 3,2+.

Et même, ElementTree de XPath, il ne peut pas travailler avec votre fichier est - il n'existe aucun moyen de sélectionner sur la base du texte d'un nœud, seulement ses attributs (ou les valeurs d'attribut).

Mon expérimentation a seulement trouvé deux façons de procéder avec ElementTree. Si vous utilisez Python 2.7+ (ou sont en mesure de télécharger et installer une version plus récente de ElementTree de travailler avec les anciennes versions de Python), et vous pouvez modifier le format du fichier XML pour mettre les chiffres en tant qu'attributs, comme
```
<Val name="number"><f val="265456" /></Val>
```
puis le code Python suivant, tirez sur les nœuds d'intérêt:
```
import xml.etree.ElementTree as ETree
tree = ETree.ElementTree(file='sample.xml')
nodes = tree.findall(".//Node/Val[@name='number']/f[@val='265456']....")
```
Pour les plus âgés des Pythons, ou si vous ne pouvez pas modifier le format XML, vous devrez filtrer les invalides nœuds manuellement. Le suivant a fonctionné pour moi:
```
import xml.etree.ElementTree as ETree
tree = ETree.ElementTree(file='sample.xml')
all = tree.findall(".//Node")
nodes = []

# Filter matching nodes and put them in the nodes variable.
for node in all:
    for val in node.getchildren():
        if val.attrib['name'] == 'number' and val.getchildren()[0].text =='265456':
            nodes.append(node)
```
Aucune de ces solutions est ce que j'appellerais l'idéal, mais ils sont les seuls que j'ai été en mesure de faire le travail avec l'ElementTree bibliothèque (puisque c'est ce que vous avez mentionné à l'aide). Vous feriez mieux d'utiliser une bibliothèque tierce, plutôt que de l'aide de l'; voir le Python wiki entrée sur XML pour une liste des options. lxml est les liaisons Python pour la plus largement utilisée de la bibliothèque libxml2, et serait celui que je suggère de regarder au premier abord. Il a en charge de XPath donc, vous devriez être en mesure d'utiliser les requêtes de l'autre des réponses.
- Vraiment gênant que Python ajouté quelques XPath soutien, mais je ne peux pas utiliser les ".." de la syntaxe pour monter à partir du nœud courant. Il devrait être indiqué dans le Python documentation. En fait le documentation indique que cette syntaxe est pris en charge. C'est peut-être pris en charge aussi longtemps que vous n'allez pas au-dessus de l'élément courant, par exemple "personne/.."? J'ai passé environ une heure à essayer de comprendre pourquoi cela ne fonctionnait pas.
InformationsquelleAutor Blair

La fonction suivante m'a aidé dans des cas similaires. Comme la docstring explique, il ne fonctionne pas dans le cas général, mais si votre nœuds sont uniques, il doit aider.

def get_element_ancestry(root, element):
'''Return a list of ancestor Elements for the given element.

If both root and element are of type xml.etree.ElementTree.Element, and if
the given root contains the given element as a descendent, then return a
list of direct xml.etree.ElementTree.Element ancestors, starting with root
and ending with element. Otherwise, return an empty list.

The xml.etree.ElementTree module offers no function to return the parent of
a given Element, presumably because an Element may be in more than one tree,
or even multiple times within a given tree, so its parent depends on the
context. This function provides a solution in the specific cases where the
caller either knows that the given element appears just once within the
tree or is satisfied with the first branch to reference the given element.
'''
result = []
xet = xml.etree.ElementTree
if not xet.iselement(root) or not xet.iselement(element):
    return result
xpath = './/' + element.tag \
    + ''.join(["[@%s='%s']" % a for a in element.items()])
parent = root
while parent != None:
    result.append(parent)
    for child in parent.findall('*'):
        if child == element:
            result.append(element)
            return result
        if child.findall(xpath).count(element):
            parent = child
            break
    else:
        return []
return result

L'OP a plus de 3 ans... C'est une bonne idée de préciser si votre réponse, en fait, il fonctionne maintenant, avec la version actuelle, l'utiliser pour travailler avant, avec les anciennes versions, ou anithing vous trouvez pertinent de le savoir.

InformationsquelleAutor GregB

-2

Généralement
```
node.parentNode 
```
sera de retour d'une potiner au nœud parent (lors de l'utilisation d'un DOM parser).

Pour XPath voir

http://www.tizag.com/xmlTutorial/xpathparent.php
- Cela ne fonctionne pas avec ElementTree, il n'y a pas d'attribut dans la version de la bibliothèque.
InformationsquelleAutor Andreas Jung

Vous devez vous connecter pour publier un commentaire.