Extraction de texte Itextsharp

Je suis en utilisant itextsharp sur vb.net pour obtenir le contenu du texte à partir d'un fichier pdf. La solution fonctionne très bien pour certains fichiers, mais pas pour les autres, même très simple. Le problème est que le jeton stringvalue est définie sur null (un ensemble de vide carrés)

token = New iTextSharp.text.pdf.PRTokeniser(pageBytes)
    While token.NextToken()
        tknType = token.TokenType()
        tknValue = token.StringValue

Je peux meassure la longueur du contenu, mais je ne peux pas obtenir de la chaîne de contenu.

J'ai réalisé que ce qui se passe en fonction de la police de la pdf. Si je créer un fichier pdf avec Acrobat ou PdfCreator avec Messagerie (c'est la police par défaut dans mon éditeur de visual studio) je peux obtenir tout le contenu du texte. Si le même fichier pdf est construit en utilisant une police de caractères différente, j'ai obtenu le vide de carrés.

Maintenant la question est, Comment puis-je extraire le texte indépendamment de la police?

Grâce

source d'informationauteur Pakhu