Programmatique de la Lecture de fichiers Pdf en C#
Je vois beaucoup de questions et de réponses sur l'utilisation de C# pour générer des fichiers PDF.
J'ai un liés, mais différents tâche.
J'ai un grand nombre de fichiers PDF déjà créé, et je voudrais valider certaines parties du contenu avec des Expressions Régulières (RegExs). Je veux ouvrir les fichiers Pdf en C#, et être en mesure de lire le texte dans quelque chose qui se rapproche d'un mode linéaire.
Si les en-têtes, pieds de page, toutes les barres latérales, etc, obtenir sauté ou la lecture de l'ordre, il n'a pas d'importance. Je suis juste après autant de corps principal du texte que je peux récupérer.
Pouvez-vous me diriger vers des outils, des bibliothèques, de l'API, etc, qui me permettra de programmation pour la lecture de texte dans les fichiers PDF?
Libellés Pas Constructif, mais il m'a aidé à comprendre ce qui est disponible! Si c'est pas un bon ajustement pour Q&Un format où ce type de question d'être publié?
Je recommande que cette de la migration vers le Logiciel de Recommandations. C'est exactement le cas pour ce site. C'est une excellente question, qui est et a été très utile pour beaucoup de gens, mais il n'a pas tout à fait l'adapter au format de.
Lorsque cette question a été posée, il y a 4 ans, je ne pense pas que le Logiciel de Recommandations de l'existence même.
OriginalL'auteur abelenky | 2010-03-09
Vous devez vous connecter pour publier un commentaire.
J'ai utilisé PDFSharp pas plus tard que la dernière automne et l'a trouvé très facile à utiliser en comparaison à d'autres. La page d'accueil de PDFSharp.
OriginalL'auteur Will Marcouiller
J'ai utilisé avec succès deux bibliothèques différentes à cet effet. On est PDF de la Boîte de (partie du projet Apache), et aussi l'un de Snowtide Informatique.
Les deux sont des bibliothèques Java, mais vous pouvez l'utiliser ensuite avec .NET en combinaison avec IKVM.
PDFxStream (née PDFTextStream) est également distribué .NET de l'assemblée (avec l'aimable autorisation de IKVM comme Nick mentionne, si la distribution est précompilé .Dll, en évitant l'exécution de l'interprétation->étape de compilation lorsque IKVM est utilisé pour consommer des bibliothèques Java comme il est).
OriginalL'auteur Nick
Il y a une bibliothèque .NET appelé
PDF Clown
Il y a aussi un bel article sur codeProject l'article
que les détails de quelques autres bibliothèques et des approches pour la lecture
Les documents PDF.
OriginalL'auteur Development 4.0
En voici une autre:
http://csharp-source.net/open-source/pdf-libraries
la question est à propos de la lecture de contenu pdf, ne générant pas.
OriginalL'auteur Joe Pitz
Ressemble iTextSharp était une réponse La lecture de documents PDF .NET
Vérifiez également Lecture/Écriture des fichiers PDF dans Visual C# Windows Forms
OriginalL'auteur SwDevMan81