Enregistrer pdf intégré de site web
Je suis en train d'écrire une petite application en C# pour la gestion de nos Fiches de données de Sécurité des produits chimiques) de nos fournisseurs.
Pour le moment, je rechercher manuellement les produits chimiques et enregistrer le document pdf et ajouter un lien vers le fichier pdf dans mon programme. Le problème est que j'ai encore beaucoup de produits chimiques pour aller de sorte qu'il serait mieux pour automatiser le processus.
Par exemple: Un produit chimique est la suivante numéro de la pièce: 271004
Le lien contenant le pdf est ici:
J'ai lu le code source de la page mais impossible de trouver un lien vers le pdf
Mais mes connaissances en html/javascript est limité pour l'instant.....
Est-il un moyen pour extraire le fichier pdf à partir du site web?
Merci d'avance pour tous les conseils 🙂
- Réponse courte: Oui, il y a un moyen. Addendum: Qu'avez-vous essayé?
Vous devez vous connecter pour publier un commentaire.
Regarder dans la page pour un élément iframe avec l'id "
msdsPageFrame
". Lesrc
attribut de l'élément qui contient l'url de votre fichier PDF. Télécharger cette url.Si vous avez des questions sur la façon de télécharger une URL ou comment analyser une page à la recherche d'un id, poser une autre question.
Maintenant, je suis en mesure d'accéder au fichier pdf directement à l'aide d'un code de produit:
http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=NL&language=EN-generic&productNumber=271004&brand=SIAL&PageToGoToURL=null
En utilisant le code suivant j'ai essayer de télécharger le pdf:
Toutefois, cela ne fonctionne pas. Le problème est que le fichier pdf est d'abord généré (prend que quelques secondes). Cependant, la AsyncCompletedEventHandler est déclenchée immédiatement. Je pense que c'est le problème, pourquoi le fichier pdf n'est pas téléchargé.