Comment cacher un site des moteurs de recherche?
Je suis à la recherche pour masquer un site de sorte qu'il n'apparaît pas dans n'importe quel moteur de recherche, je me demandais comment j'allais aller à ce sujet?
source d'informationauteur macroj
Vous devez vous connecter pour publier un commentaire.
Utiliser un robots.txt fichier: http://www.google.com/support/webmasters/bin/answer.py?answer=156449
En dehors de mot de passe-protéger votre site, vous pouvez ajouter ces lignes à
robots.txt
:Ce n'est pas cacher le site mais indique aux robots de ne araignée le contenu.
Vous pouvez en quelque sorte de réduire votre site d'être répertoriés à l'aide d'un robots.txt. Notez que cela dépend de la "bonne volonté" du robot, bien que (certains robots des spammeurs, explicitement regarder les sites que vous pas).
Le seul moyen sûr et fiable de ne pas avoir un site inscrit, malheureusement, n'est pas de le mettre sur internet.
Tout simplement pas un lien vers votre site ne fonctionne pas. Les robots d'obtenir les informations provenant de nombreuses sources, y compris le navigateur de points d'accès et les bureaux d'enregistrement de domaines. Donc, pour être "invisible", vous avez de ne pas visiter votre site et de ne pas enregistrer un nom de domaine (seul l'accès par adresse IP).
Et puis, si vous exécutez votre serveur basé sur l'adresse IP, vous avez encore toutes les spambots de sondage aléatoire d'adresses. Il va prendre un certain temps, mais ils vont vous trouver.
Mot de passe protégeant votre site devrait fonctionner efficacement, ce qui le rend inaccessible. Si (et c'est au-delà de ma compréhension de comment ça se passe), par exemple, il y a littéralement des milliers de MCA documents énumérés dans Google qui vous ne pouvez pas voir sans un compte et vous connecter. Pourtant, ils sont là.
Utiliser un robots.txtde refuser de tous les moteurs de recherche.
Ils n'ont pas tous le respect robots.txt afin de vérifier vos journaux de serveur régulièrement et refuser de plages de suspicion de robots/robots:
http://httpd.apache.org/docs/2.2/howto/access.html
Vous utilisez un
robots.txt
fichier. Placez le fichier dans la racine du site avec ce contenu:plus appropriée de moteurs de recherche utilise des bots ou des robots d'indexation de sites web et d'index. vous pourriez Robot méthode de Fichiers
Ont un coup d'oeil à
nofollow
WikipediaVous avez besoin de lire sur les robots.txt fichier vous sont censés pour copier dans votre site webroot – http://www.robotstxt.org/robotstxt.html.