Comment générer le start_urls de façon dynamique à l'analyse?

Je suis de l'analyse d'un site qui peut contenir beaucoup de start_urls, comme:

http://www.a.com/list_1_2_3.htm

Je veux remplir start_urls comme [list_\d+_\d+_\d+\.htm],
et d'en extraire des éléments à partir des URLs comme [node_\d+\.htm] lors de l'analyse.

Puis-je utiliser CrawlSpider pour réaliser cette fonction?
Et comment puis-je générer la start_urls de façon dynamique à l'analyse?

InformationsquelleAutor user1215269 | 2012-02-17