Comment convertir des fichiers Xml pour les Fichiers Texte
J'ai environ 8000 fichiers xml qui doit être convertis en fichiers texte. Le fichier texte doit contenir le titre, la description et les mots clés du fichier xml sans les balises et la suppression d'autres éléments et d'attributs. En d'autres termes, j'ai besoin de créer 8000 fichiers texte contenant le titre,la description et les mots clés du fichier xml. J'ai besoin de repères pour que cela soit fait de façon systématique. Toute aide serait grandement appréciée. Merci à l'avance.
- Veuillez prendre un coup d'oeil à mon exemple sur mon nouveau post merci stackoverflow.com/questions/2941510/...
Vous devez vous connecter pour publier un commentaire.
Va de XML texte sent comme un travail pour XSLT - il est basé sur XML, langage de transformation qui peut prendre une entrée XML et de le convertir à quoi que ce soit à base de texte sur le côté de sortie.
Vous pouvez lire sur XSLT sur beaucoup de sites web - l'un des meilleurs tutoriels dans le W3Schools un.
Puisque vous n'avez pas publier de XML exemple, je n'ai aucune idée de ce que votre XML ressemble, et d'ailleurs aucune idée de ce que votre sortie doit être. Mais en supposant qu'il ressemblerait à quelque chose comme:
vous pouvez facilement écrire une transformation XSLT pour transformer en
YourTextFile.txt
ou tout autre format que vous recherchez.
Ma suggestion serait d'utiliser Python. Vous pouvez utiliser l'interpréteur pour exécuter le modèle alors que vous êtes à l'installation de la ligne de commande va un long chemin dans la définition de ce genre de chose en place correctement. En supposant que le xml est valide, cela devrait vous permettre plus de souplesse avec le moins de tracas.
donc, en supposant que le format xml suivant:
et en supposant que la sortie de chaque document doit être:
Le code python pourrait ressembler à quelque chose comme:
à partir de laquelle vous pouvez générer un fichier de commandes pour la mise à jour régulière des fichiers (en supposant que c'est un environnement windows si python travaille dans quoi que ce soit).
Il ya un couple de possibilités. Si il est simple de XML, vous pouvez le lire comme n'importe quel autre fichier texte, filtrer les crochets et les ajouter dans votre propre stratégiquement placé des signes de ponctuation. Ou, vous pouvez ouvrir un lecteur XML et un texte de l'écrivain et à la sortie de n'importe quelle manière que vous voulez.
Si vous lisez les noms de fichiers à partir du dossier dans une collection, vous pouvez les parcourir en boucle et de traiter tous les fichiers automatiquement.
Vous pouvez utiliser la version gratuite de l' Flexter convertisseur XML pour analyser jusqu'à 50 MO compressé des fichiers XML en une seule fois. J'ai écrit un billet de blog qui vous guide à travers le processus simple de convertir XML en CSV/TSV.
J'ai eu des problèmes similaires quand j'ai copié les messages texte à partir de mon téléphone vers un fichier et c'était une .format xml et avait des symboles et des caractères entre chaque mot et je voulais modifier ceux. J'ai donc téléchargé Notepad++ et a ouvert la .xml fichier. Dites que vous voulez supprimer toutes les instances de
<title>
. Vous mettez en évidence (exemple de texte) et cliquez sur l'icône replace (c'est un bleu b→une icône dans la barre d'outils en haut). Il va falloir le texte en surbrillance dans le "Trouver" sur le terrain et ensuite, vous laissez le "Remplacer par" vide et cliquez sur Remplacer Tout, et il va se débarrasser de toutes les instances de (exemple de texte). Le faire pour tous les symboles et le texte et les remplacer par ce que vous voulez ou il devrait être. J'ai eu plus de 4800 lignes et il a très bien fonctionné.