Comment convertir un tableau HTML en tableau en python

J'ai un document html, et je veux tirer les tableaux de ce document et de les restituer sous la forme de tableaux. Je nous vois 2 fonctions, une qui trouve toutes les tables html dans un document, et une deuxième qui se transforme des tableaux html en 2-dimensions des tableaux.

Quelque chose comme ceci:

htmltables = get_tables(htmldocument)
for table in htmltables:
    array=make_array(table)

Il y a 2 captures:
1. Le nombre de tables varie au jour le jour
2. Les tables ont toutes sortes de bizarre supplémentaires de mise en forme, comme le gras et le clignotement des balises, au hasard jeté dans.

Merci!

source d'informationauteur Zach | 2010-05-20