La lecture d'un Fichier PDF à l'aide de iText5 pour .NET

Je suis à l'aide de C# en tant que plateforme de programmation et iTextSharp de lire le contenu PDF. J'ai utilisé le code ci-dessous pour lire le contenu, mais il semble qu'il lire par page.

        public string ReadPdfFile(object Filename)
        {

            string strText = string.Empty;
            try
            {
                PdfReader reader = new PdfReader((string)Filename);

                for (int page = 1; page <= reader.NumberOfPages; page++)
                {
                    ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
                    String s = PdfTextExtractor.GetTextFromPage(reader, page, its);

                    s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
                    strText = strText + s;

                }
                reader.Close();
            }
            catch (Exception ex)
            {
                MessageBox.Show(ex.Message);
            }
            return strText;
        }

Quelqu'un peut m'aider sur comment puis-je écrire un code de lecture de contenu pdf par ligne?

OriginalL'auteur Mark | 2011-12-09

c#itext pdf

14

Essayez cela, utilisez le LocationTextExtractionStrategy au lieu de la SimpleTextExtractionStrategy
il va ajouter de nouvelles de la ligne de caractères pour le texte retourné. Ensuite, vous pouvez utiliser strText.Split('\n') diviser votre texte dans un string[] et d'en consommer par la ligne de base.

OriginalL'auteur Jonathan

Vous devez vous connecter pour publier un commentaire.