PHP - Extraction de texte à partir de l'HTML J'ai une longue chaîne de HTML qui contient <p> <img> <span> et un tas d'autres balises. Est-il de toute façon d'extraire UNIQUEMENT le texte dans les balises de cette chaîne? OriginalL'auteur Dan | 2010-02-17 htmlphp 9 Si vous voulez extraire tout le texte à l'intérieur des balises, le moyen le plus simple est de supprimer les tags: strip_tags() Si vous souhaitez supprimer des balises spécifiques, peut-être ce AINSI en question aide. OriginalL'auteur Pekka 웃 1 Je sais que je vais obtenir beaucoup de dénigrement pour cela, mais pour une tâche simple comme cela, je voudrais utiliser des expressions régulières. preg_match_all('~(<span>(.*?)</span>)~', $html, $matches); $matches[0] contiendra toutes les balises span et de leur contenu, $matches[1] contient uniquement le contenu. Pour plus compliquée des choses que vous voudrez peut-être jeter un oeil à PHP Simple HTML DOM Parser ou similaires: //Create DOM from URL or file $html = str_get_html($html); //Find all images foreach($html->find('img') as $element) { echo $element->src . '<br>'; } Etc. OriginalL'auteur Tatu Ulmanen Vous devez vous connecter pour publier un commentaire.
Si vous voulez extraire tout le texte à l'intérieur des balises, le moyen le plus simple est de supprimer les tags: strip_tags()
Si vous souhaitez supprimer des balises spécifiques, peut-être ce AINSI en question aide.
OriginalL'auteur Pekka 웃
Je sais que je vais obtenir beaucoup de dénigrement pour cela, mais pour une tâche simple comme cela, je voudrais utiliser des expressions régulières.
$matches[0]
contiendra toutes les balises span et de leur contenu,$matches[1]
contient uniquement le contenu.Pour plus compliquée des choses que vous voudrez peut-être jeter un oeil à PHP Simple HTML DOM Parser ou similaires:
Etc.
OriginalL'auteur Tatu Ulmanen