Est web grattage permis?
Je suis en train de travailler sur un projet qui nécessite certaines statistiques à partir d'un autre site web, et j'ai créé un HTML racloir, qui obtient ces données toutes les 15 minutes, automatiquement. Cependant, j'ai arrêté le bot maintenant, comme dans leurs conditions d'utilisation, ils mentionnent qu'ils ne le permettent pas.
J'ai vraiment envie de respecter cela, et surtout si il y a une loi interdisant moi de prendre ces données, mais j'ai été contacter par e-mail plusieurs fois, sans qu'une seule réponse, alors maintenant, je suis venu à la conclusion que je vais tout simplement la saisie des données, si elle est légale.
Sur certains forums j'ai lu que c'EST légal, mais je préférerais de beaucoup avoir un plus "précis" réponse sur StackOverflow.
Et disons que ce n'est pas illégal, qu'ils n'auraient aucun logiciel à la place de mon bot de faire plusieurs connexions toutes les 15 minutes?
Aussi, quand on parle de la prise de leurs données, nous parlons d'un numéro unique pour chaque "équipe", et de ce nombre, je le transfert dans notre propre numéro.
la réponse est "ça dépend"
différents pays ont des lois différentes.
imaginez une boîte de dialogue: Webmaster: "dis-je,
Crawl-delay: 5 > robots.txt
". Moteur de recherche: "Okay... not more than once in 5 minute...
". Webmaster: "Non! Mauvais! Bad robot! Éloignez-vous!"...</j'> Est-ce que vous vouliez dire? LOL xDles questions juridiques sont hors sujet pour le large de la nature. je voudrais consulter un avocat.
OriginalL'auteur Mikkel | 2015-09-06
Vous devez vous connecter pour publier un commentaire.
Je vais vous citer Pablo Hoffman (Scrapinghub co-fondateur) de la réponse à "qu'est-Ce que la légalité de web scraping?", J'ai trouvé sur un autre site:
OriginalL'auteur Andrés Pérez-Albela H.
Il doit y avoir
robots.txt
fichier dans le dossier racine du site.Il y a des chemins d'accès spécifiés, qui sont
forbidden
à harceler avec des grattoirs, et ceux qui, qui estallowed
(avec un délais d'attente spécifié).Si ce fichier n'existe pas tout est permis, et vous ne prenons aucune responsabilité pour les propriétaires de site web ne parviennent pas à fournir cette info.
Aussi, ici vous pouvez trouver quelques explications sur
robots exclusion standard
.Seulement si ils ne sont pas de porter un signe qui dit "merci de ne pas me frapper".
Même si c'est contraire à l'éthique de lire robots.txt et analyser seulement permis de pages, il n'est pas légalement obligatoire
OriginalL'auteur ankhzet