Comment analyser un fichier HTML avec la table à l'aide de Python

J'ai un fichier html avec une table ( c'est un grand un seul, de sorte que seules exemple de code est donné ). Je veux récupérer les valeurs dans les tableaux. J'ai essayé le HTMLParser bibliothèque à partir de python.

J'ai commencé à coder comme ci-dessous. Ensuite, j'ai trouvé que l'attribut "class" est le même que le système défini de mot-clé. Donc sa me donne erreur.

class MyHTMLParser(HTMLParser):

    def handle_starttag(self, tag, attrs):
        if tag == 'tr':
            for class in attrs:
                if class == 'Table_row'

p = MyHTMLParser()
p.feed(ht)   

Code HTML pour table

<table class="Table_rows" cellspacing="0" rules="all" border="1" id="MyDataGrid" style="width:700px;border-collapse:collapse;">

                    <tr class="Table_Heading">

                        <td>STATION CODE</td><td>STATION NAME</td><td>SCHEDULED ARRIVAL</td><td>SCHEDULED DEPARTURE</td><td>ACTUAL/ EXPECTED ARRIVAL</td><td>ACTUAL/ EXPECTED DEPARTURE</td>

                    </tr><tr class="Table_row">

                        <td>TVC </td><td style="width:160px;">ORIGON</td><td>Starting Station </td><td>05:00, 07 May 2011</td><td>Starting Station</td><td>05:00, 07 May 2011</td>

                    </tr><tr class="alternat_table_row">

                        <td>TVP </td><td>NEY YORK</td><td>05:04, 07 May 2011</td><td>05:05, 07 May 2011</td><td>05:04, 07 May 2011</td><td>05:05, 07 May 2011</td>

</tr>               
</table>

Mise à JOUR

Comment pourrais-je obtenir des données entre les balises?

InformationsquelleAutor user567879 | 2011-05-07