La lecture d'un Fichier PDF à l'aide de iText5 pour .NET
Je suis à l'aide de C# en tant que plateforme de programmation et iTextSharp
de lire le contenu PDF. J'ai utilisé le code ci-dessous pour lire le contenu, mais il semble qu'il lire par page.
public string ReadPdfFile(object Filename)
{
string strText = string.Empty;
try
{
PdfReader reader = new PdfReader((string)Filename);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
strText = strText + s;
}
reader.Close();
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
return strText;
}
Quelqu'un peut m'aider sur comment puis-je écrire un code de lecture de contenu pdf par ligne?
OriginalL'auteur Mark | 2011-12-09
Vous devez vous connecter pour publier un commentaire.
Essayez cela, utilisez le
LocationTextExtractionStrategy
au lieu de laSimpleTextExtractionStrategy
il va ajouter de nouvelles de la ligne de caractères pour le texte retourné. Ensuite, vous pouvez utiliser
strText.Split('\n')
diviser votre texte dans unstring[]
et d'en consommer par la ligne de base.OriginalL'auteur Jonathan