À la lecture .docx en C++
Je suis en train de créer un programme qui lit un .docx fichier et affiche le contenu d'un blog/forum pour un usage personnel. J'ai enfin compris comment utiliser libcurl à faire (ce que j'ai compris) a été la partie la plus difficile du programme. Maintenant j'ai juste à lire la .fichier docx, mais sous un hic. Je n'arrive pas à trouver toute la documentation sur la façon de le faire. Des idées?
OriginalL'auteur mcFreid | 2009-07-21
Vous devez vous connecter pour publier un commentaire.
La façon la plus simple est d'utiliser Word pour ce faire. Il a des limitations sur les licences.
La DONC, la question La création, l'ouverture et l'impression d'un fichier word à partir de C++ a quelques bonnes références.
Edit:
En fonction de ces questions/réponses peut décompresser le fichier Open XML et traiter le fichier XML directement:
Si vous utilisez .NET il y a plus d' (C#) questions à lire:
OriginalL'auteur Peter Olsson
Si vous voulez rester sur le monde open source, OpenOffice 3 doit être capable de traiter .les fichiers docx. Il y a un projet de mise en place d'une API pour de nombreuses langues, je ne sais pas vraiment comment compléter ou complexes, il est.
Il y a un script en PHP qui permet de convertir de .docx en texte brut. C'est, si vous ne craignez pas que tous les docs sont en russe). Que pourrait être une autre option (qui déclenche le script php avec un appel système et l'analyse des résultats à partir d'un fichier)
OriginalL'auteur David Rodríguez - dribeas