Web Cralwer Algorithme: profondeur?

Je travaille sur un robot et besoin de comprendre exactement ce que l'on entend par "lien de la profondeur". Prendre nutch par exemple: http://wiki.apache.org/nutch/NutchTutorial

profondeur indique le lien de la profondeur à partir de la racine de la page qui doit être
analysé.

Donc, dire que j'ai du domaine www.domain.com et je voulais analyser une profondeur de, disons, 3 -- que dois-je faire? Si un site peut être représenté comme un arbre binaire, alors il ne serait pas un problème je pense.

  • vous avez dit un site pourrait être représenté comme un arbre binaire, mais je pense qu'il pourrait être représenté comme un graphe, puisque les liens peuvent lier les uns aux autres plus d'une fois et une croix les uns des autres. Vous pouvez même avoir impasse des liens que jamais de lien vers d'autres pages, mais seulement pour elle-même. Donc on peut considérer le site web ou de l'internet comme un graphique je pense.