Les données de Grattage de PDF et Excel
Je fais un peu de données de grattage, Il y a 3 types de fichiers à partir de laquelle je suis grattage de données.
1 - HTML
2 - PDF
3 - Excel(xls)
Pour le HTML, je suis à l'aise, je suis en utilisant le HTML Agilité.
PDF et excel j'ai besoin de conseils de personne.
Merci d'avance.
OriginalL'auteur Sakhawat Ali | 2010-06-30
Vous devez vous connecter pour publier un commentaire.
Concernant Excel. Si vous êtes dans un environnement MS, vous pouvez soit faire de la bureautique ou de l'utilisation OLEDB. Dans un environnement Java regardez Apache POI.
EDIT: Concernant les PDF en Java essayez Apache PDFBox . Peut aussi travailler en .NET en utilisant IKVM
OriginalL'auteur renick
Je peux recommander Cogniview de PDF2XL, raisonnablement bon marché produit commercial, pour extraire des données à partir de tables dans des dossiers de PDF en Excel. Nous avons utilisé avec grand succès.
OriginalL'auteur Govert
HTML Agility est une bibliothèque. Sa bonne utilisation. Mais alors, pourquoi avez-vous besoin des outils distincts pour les différents extraction de données? L'utilisation de l'Automatisation n'importe où pour extraire des données à partir de n'importe quelle source. Autant que je sache, cela pourrait fonctionner pour tous les trois sources que vous avez spécifié.
Une recherche sur Google.
OriginalL'auteur Bob
Vous pouvez utiliser UiPath afin d'atteindre cet objectif. Il peut gratter précis à 100% PDF, Excel, HTML, Java, Windows, .NET, WPF, héritage. Fonctionne également avec les environnements virtualisés, mais seulement via OCR grattage.
Peut être utilisé à partir de code (SDK), mais vous pouvez également créer des visuels d'automatisation (flux de travail) à l'aide de UiPath Studio.
Voici un tutoriel sur la web d'extraction de données
Remarque: je travaille à UiPath donc je sais qu'il peut faire le travail. Vous devriez également essayer d'autres visuels de l'automatisation des outils comme l'Automatisation n'importe où, WinAutomation, Jacada, utilisez-les côte à côte et de choisir celui qui vous convient le mieux.
OriginalL'auteur mbadit