Pouvez-vous donner des exemples de l'analyse de l'HTML?

Comment parser du HTML avec une variété de langues et de bibliothèques d'analyse?


Lorsque vous répondez:

Commentaires individuels sera lié dans les réponses à des questions sur la façon d'analyser HTML avec regexes comme une façon de montrer la bonne façon de faire les choses.

Par souci de cohérence, je demande que l'exemple de l'analyse d'un fichier HTML pour la href dans les balises d'ancrage. Pour faciliter la recherche à cette question, je vous demande de suivre ce format

Langue: [nom de la langue]

Bibliothèque: [nom de la bibliothèque]

[example code]

Merci de faire de la bibliothèque un lien vers la documentation pour la bibliothèque. Si vous voulez donner un exemple autre que l'extraction de liens, veuillez également inclure:

Objet: [ce que l'analyse n']

  • répétez l'opération pour chaque exemple, le HTML générateur de code est inutile
  • et pourquoi vous êtes clutting code perl avec inutile/inutile d'utiliser les directives? (mises en garde et stricte)
  • Autonome, exemples de travail sont meilleures. Tous les code Perl devrait inclure stricte et des avertissements, ils ne sont pas inutiles; ils sont une partie Moderne de Perl. Je frémis à penser que votre code ressemble à si vous pensez qu'ils sont "inutiles" et "inutile".
  • dans mon code j'utilise toujours les mises en garde et stricte; dans CE contexte, ils sont inutiles. Les plus de cette les échantillons ne sont pas "autonome" (par exemple, jquery, ruby et les autres réponses), alors pourquoi s'embêter avec perl solutions?
  • Parce que vous le pouvez, et les exemples de JavaScript sont autonomes dans leur environnement. Je n'ai pas changé le nokogiri exemple parce que je ne peux pas obtenir nokogiri pour l'installer sur ma machine. Je ne veux pas modifier le code, je ne comprends pas. Mais je vais le changer; pour une chose qu'il ne regarde pas comme il est de la résolution de l'exemple. Comme pour l'utilisation stricte, la modélisation code unsafe pour les gens qui sont l'apprentissage est un crime. Ils ont besoin de tous les armatures qu'ils peuvent obtenir.
  • vous ajoutez de distraire les choses; use strict et des ressources de traitement n'est pas le point central de la question
  • Baxter Quelle partie de "Cette question est une manière paresseuse de collecte d'exemples de parsing HTML avec une variété de langues et de bibliothèques d'analyse." n'avez-vous pas comprendre?
  • Le C et le C++ sont marqués, mais n'ont pas un exemple ici. 🙁
  • Oui, ils sont marqués de sorte que quelqu'un va donner un exemple.