la lecture docx (Office Open XML) en PHP
Je veux ajouter un mot, une fonction d'importation de notre CMS, le seul problème que j'ai ne semble trouver une bonne bibliothèque pour la lecture des fichiers docx (Word 2007).
Faire ce que quelqu'un a des recommandations, la bibliothèque doit être en mesure d'extraire le contenu du document de base et de style, comme l'italique, le gras, en exposant?
Merci pour votre aide
OriginalL'auteur RageZ | 2009-10-01
Vous devez vous connecter pour publier un commentaire.
Ou, puisque vous avez demandé une bibliothèque, vous aimeriez peut-être quelque chose comme Docvert. Je viens de regarder le tour sur la base de votre question, et c'est mon préféré jusqu'à présent pour PHP. Vous entrez le mot de l'emplacement du fichier, il le transforme en quelque chose de simple avec les attributs et toutes ces bonnes choses.
OriginalL'auteur Anthony
docx
fichiers sont en fait des conteneurs uniquement pour le document XML. Vous devriez être capable de décompresser le fichier docx, puis aller dans le dossier de word à l'intérieur, puis à l'document.xml. C'est le texte lui-même. Mais des choses comme les polices et les styles sont dans d'autres fichiers xml dans le docx conteneur, de sorte que vous aurez probablement envie de déconner un peu et de comprendre ce qui est quoi et comment faire correspondre (commencez par utiliser les espaces de noms, je parie).Mais oui, décompressez le fichier, puis utiliser simplexml pour le convertir en quelque chose que vous pouvez réellement s'amuser avec.
Voir mon autre réponse. La seule chose que je n'aime pas c'est le manque de facile de trouver de l'API
la classe TbsZip peut lire (et même de les modifier) le contenu des archives zip sans aucune dépendance ni tous les fichiers temporaires. XML d'analyse peut être fait avec plusieurs autres outils.
OriginalL'auteur Anthony
PHPDocX PRO comprend un TransformDoc classe qui peut lire .docx (zip) des fichiers et générer du XHTML (ou PDF) à partir de:
Nope, son disponible sur community edition.
OriginalL'auteur Scott Evernden
Il y a une bibliothèque à faire cela, mais il fonctionne avec Zend framework est peut-être ça va vous aider
Il est appelé phpLiveDocx : http://www.phplivedocx.org/downloads/
La bibliothèque est concédé sous licence en vertu de la Nouvelle Bcd
OriginalL'auteur sohaibafifi
Je viens de trouver une bibliothèque qui possède à la fois la lecture et l'écriture de soutien vérifier sur le site codeplex forge http://openxmlapi.codeplex.com et il est sous licence en vertu de GPLv2 .
OriginalL'auteur sohaibafifi
Convertir un docx document odt en utilisant OpenOffice. Utilisez ensuite eZ Components à faire l'analyse et de l'importation. Ils utilisent effectivement l'importation dans leur CMZ eZ Publish.
OriginalL'auteur DrDol
Ici est une simple solution de travail, j'ai trouvé
http://webcheatsheet.com/php/reading_the_clean_text_from_docx_odt.php
OriginalL'auteur andrebruton