Peut simplexml être utilisé pour fusil par le html?
Je voudrais saisir des données à partir d'une table sans l'aide d'expressions régulières. J'ai apprécié l'aide de simplexml pour l'analyse des flux RSS et voudrais savoir si il peut être utilisé pour saisir une table à partir d'une autre page.
Par exemple. Récupérer la page avec curl ou tout simplement file_get_contents(); ensuite utiliser simplexml pour saisir le contenu?
Vous devez vous connecter pour publier un commentaire.
Vous pouvez utiliser le
loadHTML
fonction du DOM de module, puis les importer DOM en SimpleXML viasimplexml_import_dom
:simplexml_import_dom
et un tout petit peu plus d'explications.Si c'est du XHTML — oui, c'est certainement possible. Vrai XHTML est juste du XML à la fin, de sorte qu'il peut être analysé avec un analyseur XML.
SimpleXML, cependant, n'accepte que les strictes XML. Si vous ne pouvez pas obtenir XHTML valide, il ressemble de le mettre à la moins stricte
DOMDocument
bibliothèque de première fera l'affaire (source ici):Ma version tolère les erreurs et les problèmes avec l'encodage
Il peut dépendre d'une page. Si la page est en XHTML (la plupart des pages web de nos jours), alors tous les parser XML devrait le faire, sinon regarder pour analyseur SGML. Voici une question similaire, vous pourriez être intéressé par: Tolérante des erreurs HTML/XML/SGML l'analyse en PHP