Comment faire pour modifier le contenu de la balise HTML en Java?

Comment puis-je modifier le contenu HTML de la balise en Java? Par exemple:

avant:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**text**</div>text</div>
    </body>
</html>

après:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**new text**</div>text</div>
    </body>
</html>

J'ai essayé JTidy, mais il ne prend pas en charge getTextContent. Est-il une autre solution?


Merci, je veux analyser pas bien formé HTML. J'ai essayé TagSoup, mais quand j'ai ce code:

<body>
sometext <div>text</div>
</body>

et je veux changer "sometext" à "someAnotherText," et quand j'utilise {bodyNode}.getTextContent() il me donne: "sometext texte"; lorsque j'utilise setTextContet("someAnotherText"+{bodyNode}.getTextContent()), et sérialiser ces structure, le résultat est <body>someAnotherText sometext text</body>, sans <div> balises. C'est un problème pour moi.

InformationsquelleAutor bugisoft | 2009-12-19