Extrait du texte en PDF par des coordonnées

J'aimerais savoir s'il existe un PDF de la bibliothèque de Microsoft .NET d'être en mesure de l'extraction de texte en donnant les coordonnées.

Par exemple (en pseudo-code):

PdfReader reader = new PdfReader();
reader.Load("file.pdf");

//Top, bottom, left, right in pixels or any other unit
string wholeText = reader.GetText(100, 150, 20, 50);

J'ai essayé de le faire à l'aide de PDFBox pour .NET (que l'on travaille sur le dessus de IKVM) avec pas de chance, et il semble être très désuet et sans-papiers.

Peut-être quelqu'un a un bon exemple de le faire avec PDFBox, iTextSharp ou de tout autre open-source de la bibliothèque, et il/elle peut me donner un indice.

Vous en remercie d'avance.

Ne pensez-vous pas que le zoom d'un point de vue de modifier ce texte est désigné coordonnées? De l'extraction de données en fonction de leur position dans la représentation, en particulier lorsqu'il est susceptible de changer, me semble être une fonctionnalité que la lib développeurs ne serait pas juste de la peine à réaliser dans leur application.
ne sais pas du tout opensource bibliothèque capable de cela... SI une bibliothèque commerciale est une option que je pourrais donner un ou deux liens...
Vous avez raison, mais mon projet aura une taille fixe visionneuse de PDF, alors je crois que ce n'est pas la situation que vous êtes en train de parler. Par exemple, dans Adobe Reader, lorsque vous sélectionnez quelque chose comme une image et un zoom-in et zoom-out, la sélection est redimensionnée. Peut-être que cela peut être réalisé qu'avec une bibliothèque. En fait, Apache PDFBox a quelque chose comme le choix des régions offrant un rectangle, ce qui signifie que je ne suis pas aussi fou que vous avez pensé 😀
cela dépendra de prix, mais de me donner ces conseils dans les commentaires et je vais prendre un coup d'oeil.

OriginalL'auteur Matías Fidemraizer | 2011-09-13