RegEx pour obtenir href et de la src à partir du contenu HTML?

Je suis en train d'extraire href src et les liens à partir d'une chaîne HTML. Selon ce post, J'ai été en mesure d'obtenir l'image de la partie. Quelqu'un peut-il aider à ajuster l'expression régulière pour inclure le href URL dans la collection de trop?

public List<string> GetLinksFromHtml(string content)
{
    string regex = @"<img[^>]*?src\s*=\s*[""']?([^'"" >]+?)[ '""][^>]*?>";
    var matches = Regex.Matches(content, regex, RegexOptions.IgnoreCase | RegexOptions.Singleline);
    var links = new List<string>();

    foreach (Match item in matches)
    {
        string link = item.Groups[1].Value;
        links.Add(link);
    }

    return links;
}
Pourquoi ne pas simplement utiliser un analyseur HTML pour cela?
Je ne veux pas avoir à déployer une bibliothèque. Il est censé être une lumière et d'une méthode rapide, je peux facilement tomber dans n'importe quel projet.
Vous devriez penser à utiliser une bibliothèque. Pour un hack Regex HTML et pourrait fonctionner, mais si vous allez l'utiliser plus souvent, vous aurez un jour essayer d'analyser html avec le mal de commentaires et de javascript intégré et tout va exploser.
Une expression régulière est un mauvais choix pour les sauvages HTML. Toutefois, si vous pouvez garantir à 100% que les balises que vous serez d'analyse sont les vôtres et sont tout à fait valable, les balises d'image vous pouvez être en mesure de sortir avec elle. Peu importe, HtmlAgilityPack est la solution parfaite.

OriginalL'auteur TruMan1 | 2011-11-09