Est-il un moyen dans la belle soupe pour compter le nombre de balises dans une page html
Je suis à la recherche à la création d'un dictionnaire en python dont la clé est le nom de la balise html et la valeur est le nombre de fois que le tag est apparu. Est-il un moyen de faire ça avec de belles soupe ou autre chose?
Vous devez vous connecter pour publier un commentaire.
Avec BeautifulSoup vous pouvez rechercher toutes les balises en omettant les critères de recherche:
Si vous n'êtes intéressé que par le nombre d'occurrences, BeautifulSoup peut-être un peu exagéré dans ce cas, vous pourriez utiliser le
HTMLParser
à la place:Cela produira le même résultat.
Pour créer le dictionnaire de
{ 'tag' : count }
vous pouvez utilisercollections.defaultdict
:BeautifulSoup est vraiment bon pour analyse HTML, et vous pouvez certainement l'utiliser à cette fin. Il serait extrêmement simple: