Meilleur moyen pour un débutant d'apprendre capture d'écran par Python

Cela pourrait être une de ces questions difficiles à répondre, mais va ici:

Je ne considère pas mon auto - programmeur, mais je voudrais 🙂 j'ai appris R, parce que j'étais malade et fatigué de spss, et parce qu'un ami m'a initié à la langue - je ne suis pas un étranger à la logique de programmation.

Maintenant, je voudrais apprendre le langage python - principalement à faire de capture d'écran et l'analyse de texte, mais aussi pour l'écriture des webapps avec des Pylônes ou Django.

Donc: Comment dois-je apprendre à écran gratter avec python? J'ai commencé à aller à travers le scrappy docs mais je me sens bien "magique" qui se passe après tout, je suis en train d'apprendre, et pas seulement faire.

D'autre part: Il n'y a pas de raison de réinventer la roue, et si Scrapy est-à-capture d'écran de ce que Django est de pages web, Il se pourrait après tout être la peine de sauter directement dans Scrapy. Qu'en pensez-vous?

Oh - BTW: Le type de capture d'écran: je veux gratter les sites des journaux (c'est à dire assez complexe et grand) pour les mentions de politiciens etc. - Cela signifie que j'ai besoin de gratter quotidien, de manière itérative et récursive - et j'ai besoin d'enregistrer les résultats dans une base de données de toutes sortes - qui me conduisent à une question bonus: tout le monde parle de nonSQL DB. Dois-je apprendre à utiliser, par exemple, mongoDB tout de suite (je ne pense pas que j'ai besoin d'une forte cohérence), ou est-ce insensé, ce que je veux faire?

Je vous remercie pour toutes les pensées - et je m'en excuse si c'est général pour être considéré comme une question de programmation.

  • Une chose qui vous aide lors de la création de la bonne grattoirs, est la connaissance que vous avez sur HTTP/Web (Cookies, Redirections,...) 😉
  • Pas une réponse directe à votre question, mais vous voudrez peut-être consulter cette vidéo: youtube.com/watch?v=52wxGESwQSA il couvre beaucoup de sujets plus avancés sur screenscraping. Il s'agit du point de vue de python, mais pour la plupart, il n'en termes de théorie et est en grande partie la langue agnostique.
InformationsquelleAutor Andreas | 2010-12-01