Comment enregistrer un document Jsoup dans un fichier HTML?
J'ai utilisé cette méthode pour récupérer une page web dans un org.jsoup.nodes.Document
objet:
myDoc = Jsoup.connect(myURL).ignoreContentType(true).get();
Comment dois-je rédiger cet objet à un fichier HTML?
Les méthodes myDoc.html()
, myDoc.text()
et myDoc.toString()
n'est pas sortie de tous les éléments du document.
Certaines informations dans un élément javascript peut être perdu dans l'analyse. Par exemple, "timestamp" dans la source d'un Instagram médias page.
source d'informationauteur Ali Khezeli
Vous devez vous connecter pour publier un commentaire.
Le fait qu'il y a des éléments qui sont ignorés, doit être à cause de la tentative de normalisation par Jsoup.
Afin d'obtenir le serveur de sortie exacte, sans aucune forme de normalisation de l'utiliser.
Utilisation
doc.outerHtml()
.N'oubliez pas d'attraper les Exceptions. Ajouter la dépendance ou la télécharger Apache commons-io bibliothèque pour moyen facile et rapide pour l'enregistrement de fichiers au format UTF-8.