Comment explorer un site web / extraire des données dans une base de données avec python?

J'aimerais construire une webapp pour aider d'autres étudiants de mon université créer leurs horaires. Pour ce faire j'ai besoin d'analyser les schémas directeurs (un énorme page html) ainsi qu'un lien pour une description détaillée pour chaque cours dans une base de données, de préférence en python. Aussi, j'ai besoin de vous connecter pour accéder à ces données.

  • Comment cela fonctionnerait-il?
  • Quels outils/bibliothèques/dois-je utiliser?
  • Sont là de bons tutoriels sur cette?
  • Comment puis-je mieux faire face à des données binaires (par exemple, joli pdf)?
  • Le sont déjà de bonnes solutions pour que?

source d'informationauteur McEnroe