comment extraire le contenu de <div> balise java
j'ai un sérieux problème.
je voudrais extraire le contenu de la balise tels que:
<div class="main-content">
<div class="sub-content">Sub content here</div>
Main content here </div>
sortie j'attendrais est:
Sous contenu ici
contenu Principal ici
j'ai essayé en utilisant les regex, mais le résultat n'est pas si impressionnant.
À l'aide de:
Pattern.compile("<div>(\\S+)</div>");
retournera toutes les cordes avant de le premier <*/div> tag
donc, quelqu'un pourrait-il m'aider pls?
Ne pas utiliser une expression Régulière pour l'analyse HTML. Utiliser un analyseur HTML, reportez-vous à cette question: stackoverflow.com/questions/238036/java-html-parsing
O. k je le saurai
stackoverflow.com/questions/1732348/... 🙂
O. k je le saurai
stackoverflow.com/questions/1732348/... 🙂
OriginalL'auteur kyo21 | 2011-05-17
Vous devez vous connecter pour publier un commentaire.
Je recommande d'éviter les regex pour l'analyse de code HTML. Vous pouvez facilement faire ce que vous lui demandez de l'aide Jsoup:
En réponse à un commentaire: si vous voulez mettre le contenu de la
div
des éléments dans un tableau deString
s, vous pouvez tout simplement faire:En réponse à un commentaire: si vous avez des éléments imbriqués et que vous voulez obtenir propre texte pour chaque élément que vous pouvez utiliser jquery plusieurs sélecteur de syntaxe. Voici un exemple:
Le code ci-dessus va analyser le code HTML suivant:
et d'imprimer le résultat suivant:
vous êtes les bienvenus 🙂
euh...si je voudrais ajouter chaque <div> contenu dans un tableau? toute suggestion? merci
J'ai ajouté un peu de code pour ma réponse pour répondre à votre question sur la
div
contenu dans un tableau.vous êtes les bienvenus 🙂
OriginalL'auteur MarcoS
À partir de ce code si vous voulez obtenir le résultat que vous avez mentionné
Utilisation
document.getElementById("mainCon").innerHTML
il donnera contenu Principal ici avec sous-div mais vous analysez cette chose.Et de même pour les sous-div, vous pouvez utiliser le code ci-dessus sniplet c'est à dire
document.getElementById("subCon").innerHTML
Oui, vous donnez manuel id pour chaque div et vous pouvez aussi lui donner de façon dynamique avec javascript.
OriginalL'auteur Ankit