Capture d'écran du code HTML avec C#

J'ai été donné la tâche au travail de capture d'écran l'un de nos hérité d'applications web pour extraire certaines données à partir du code. Les données sont formatées et "devrait" être affiché exactement la même à chaque fois. Je ne suis pas sûr de savoir comment aller à ce sujet. C'est un fichier html avec en-tête et pied de page navigations mais au milieu de tout cela, est que les données dont j'ai besoin.

J'ai besoin d'extraire le Nom de la Société de la valeur, le Nom du Contact, numéro de Téléphone, adresse email, etc.

Voici un exemple de ce à quoi ressemble le code:

...html above here
<br /><br />
<table cellpadding="0" cellspacing="12" border="0">
<tr>
<td valign="top" align="center">
<!-- Company Info -->
<table cellpadding="0" cellspacing="0" border="0">
<tr>
<td class="black">
<table cellspacing="1" cellpadding="0" border="0" width="370">
<tr>
<th>ABC INDUSTRIES</th>
</tr>
<tr>
<td class="search">
<table cellpadding="5" cellspacing="0" border="0" width="100%">
<tr>
<td>
<table cellpadding="1" cellspacing="0" border="0" width="100%">
<tr>
<td align="center" colspan="2"><hr></td>
</tr>
<tr>
<td align="right" nowrap><b><font color="FF0000">Contact Person&nbsp;<img src="/images/icon_contact.gif" align="absmiddle">&nbsp;:</font></b></td>
<td align="left" width="100%">&nbsp;Joe Smith</td>
</tr>
<tr>
<td align="right" nowrap><b><font color="FF0000">Phone Number&nbsp;<img src="/images/icon_phone.gif" align="absmiddle">&nbsp;:</font></b></td>
<td align="left" width="100%">&nbsp;555-555-5555</td>
</tr>
<tr>
<td align="right" nowrap><b><font color="FF0000">E-mail Address&nbsp;<img src="/images/icon_email.gif" align="absmiddle">&nbsp;:</font></b></td>
<td align="left" width="100%">&nbsp;<a HREF="mailto:[email protected]">joe@joe.com</a></td>
</tr>
more...

Il n'y a plus de code sur l'écran dans une autre structure de la table que j'ai aussi besoin de tirer.

Si le HTML est bien formaté en XML, il devrait être assez facile à déposer le texte dans un document XML et d'obtenir les pièces dont vous avez besoin avec XPath ou XSL.

OriginalL'auteur WildBill | 2011-01-03