Comment obtenir le source HTML d'une page à partir d'un lien HTML sur Android?
Je travaille sur une application qui a besoin d'obtenir le code source d'une page web à partir d'un lien, et ensuite d'analyser le code html de la page.
Pourriez-vous me donner quelques exemples, ou les points de départ où chercher pour commencer l'écriture d'une telle application?
- Il n'est pas totalement clair ce que vous voulez faire? Je suppose que vous voulez pour obtenir la page web, puis parser le html?
- je suis en train de travailler sur l'analyse html. première tâche, je tiens à obtenir le source html de mon lien html. comment faire? désolé pour mon pire en anglais. merci pour m'encourager.
- Pas de problème, j'ai essayé de reformuler votre question un peu. J'espère, c'est encore la même question 🙂 Pour d'autres questions, votre question est très large. Nous aimons les questions qui sont un peu plus spécial et avoir un seul problème dans votre application peut-être avec un exemple de code pour expliquer votre problème...
Vous devez vous connecter pour publier un commentaire.
Vous pouvez utiliser HttpClient pour effectuer un HTTP GET et récupérer le code HTML de la réponse, quelque chose comme ceci:
new URI("http://www.google.com/")
. De toutes les autorisations nécessaires autres que "android.la permission.INTERNET"?String html = EntityUtils.toString(response.getEntity());
Je dirais jsoup.
Selon leur site web:
Chercher la page d'accueil de Wikipédia, l'analyser pour un DOM, et sélectionnez les titres de la Dans la section des nouvelles dans une liste d'Éléments (en ligne de l'échantillon):
Prise en main:
Cette question est un peu vieux, mais j'ai pensé que je devrais poster ma réponse maintenant que
DefaultHttpClient
,HttpGet
, etc. sont déconseillés. Cette fonction doit obtenir et de retour HTML, compte tenu d'une URL.Si vous avez un coup d'oeil ici ou ici, vous verrez que vous ne pouvez pas le faire directement avec l'API android, vous avez besoin d'une librairie externe...
Vous pouvez choisir entre les 2 ci-dessus, si vous avez besoin d'une librairie externe.
L'appeler comme
RetrieveFeedTask.class
OnTaskFinished.java
L'un de l'autre DONC post réponse m'a aidé. Ce n'est pas lire ligne par ligne; on peut supposer que le fichier html a une ligne null entre les deux. Comme condition préalable ajouter cette dépendance de paramètres du projet "com.koushikdutta.ion:ion:2.2.1" mettre en œuvre ce code dans AsyncTASK. Si vous voulez le retour de l' -quelque chose- être dans le thread de l'INTERFACE utilisateur, le passer à une mutuelle d'interface.