Comment faire pour convertir un .docx en html à l'aide de asp.net?
Word 2007 enregistre ses documents .docx format qui est vraiment un fichier zip avec un tas de choses, y compris un fichier xml avec le document.
Je veux être en mesure de prendre un .docx fichier et de le déposer dans un dossier dans mon asp.net web app et le code open la .fichier docx, et de rendre le xml (partie de la) document en tant que page web.
J'ai été à la recherche sur le web pour plus d'informations sur ce sujet, mais jusqu'à présent n'ont pas trouvé grand chose. Mes questions sont les suivantes:
- Voulez-vous (a) utiliser XSLT pour transformer le XML en HTML, ou (b) utiliser les bibliothèques de manipulation .net (comme XDocument et XElement en 3.5) pour convertir en HTML ou (c) d'autres?
- Connaissez-vous des bibliothèques open source/projets qui ont fait ce que je pouvais l'utiliser comme un point de départ?
Merci!
OriginalL'auteur Guy | 2008-09-10
Vous devez vous connecter pour publier un commentaire.
Essayer cette post? Je ne sais pas, mais peut-être ce que vous cherchez.
OriginalL'auteur Adam Lerman
J'ai écrit mammoth.js, qui est une bibliothèque JavaScript qui convertit les fichiers docx en HTML. Si vous voulez faire le rendu côté serveur .NET, il y a aussi une .La version NET de Mammouth disponible sur NuGet.
Mammouth essaie de produire du HTML propre en regardant sémantique de l'information-par exemple, la cartographie des styles de paragraphe dans Word (comme
Heading 1
) pour les balises appropriées et le style dans le HTML/CSS (comme<h1>
). Si vous voulez quelque chose qui produit une exacte copie de visual, puis Mammouth n'est probablement pas pour vous. Si vous avez quelque chose qui est déjà bien structuré et que vous voulez convertir que pour tidy HTML, Mammouth pourrait faire l'affaire.OriginalL'auteur Michael Williamson
Word 2007 a une API que vous pouvez utiliser pour convertir au format HTML. Voici un post qui en parle http://msdn.microsoft.com/en-us/magazine/cc163526.aspx. Vous pouvez trouver de la documentation autour de l'API, mais je me souviens qu'il y a une conversion HTML fonction dans l'API.
OriginalL'auteur Vaibhav
Ce code permet de convertir
.docx
fichier texteOriginalL'auteur raghava
Je suis à l'aide de l'Interopérabilité. C'est un peu problamatic mais qui fonctionne bien dans la plupart des cas.
Ce on renvoie la liste des html les documents convertis " path
Et celui-ci pour convertir doc au format html.
La mise à mort de la parole n'est pas amusant, mais ne peut pas le laisser pendre là et d'en bloquer d'autres, non?
Dans le web/html, j'ai rendu html d'une iframe.
Il y a une liste déroulante qui contient la liste des documents d'aide. La valeur est le chemin d'accès à la version html de ce texte et est le nom du document.
sur une sélection d'index a changé, il est renedred à l'image
Je sais que c'est horrible idée, mais les exigences n'est pas facile de faire dérailler de la portée. Je serais très apprécier une bonne alternative pour cette de demander.
OriginalL'auteur messed-up