Comment analyser une page web et extraire tous les liens href?

Je veux analyser une page web dans Groovy et extrait tous les liens href et le texte associé avec elle.

Si la page contenant ces liens:

<a href="http://www.google.com">Google</a><br />
<a href="http://www.apple.com">Apple</a>

la sortie serait:

Google, http://www.google.com<br />
Apple, http://www.apple.com

Je suis à la recherche d'un Groovy réponse. AKA. Le moyen le plus facile!

source d'informationauteur