Regex Extraire des Corps html
Comment puis-je utiliser les Regex extraire le corps de html, doc,
tenant compte du fait que le html et les balises de corps pourrait être en majuscules, minuscules ou peut ne pas exister?
- Double de stackoverflow.com/questions/356340/... ?
Vous devez vous connecter pour publier un commentaire.
Ne pas utiliser une expression régulière pour cela utiliser quelque chose comme le Html Agility Pack.
Ensuite, vous pouvez extraire le
body
avec un XPATH.Comment quelque chose comme cela?
Il capte tout ce qui est entre
<body></body>
balises (insensible à la casse due àRegexOptions.IgnoreCase
) dans un groupe nommétheBody
.RegexOptions.Singleline
nous permet de gérer plusieurs lignes de code HTML comme une seule chaîne.Si le HTML ne contient pas de
<body></body>
de tags,Success
propriété du match sera faux.Cela devrait vous obtenez assez proche: