Comment protéger un site à partir d' (google) la mise en cache?
Je voudrais masquer certains contenus du public (tels que google les pages mises en cache). Est-il possible?
OriginalL'auteur | 2011-06-06
Vous devez vous connecter pour publier un commentaire.
Option 1: Désactiver " Afficher Le Cache Du Site Dans Les Résultats De Recherche Google
Si vous voulez empêcher google d'archivage de votre site, ajouter la balise meta suivante à votre section:
Si votre site est déjà mis en cache par Google, vous pouvez demander sa suppression à l'aide de Google l'URL de l'outil de suppression de. Pour plus d'instructions sur la façon d'utiliser cet outil, voir "Supprimer une page ou un site des résultats de recherche Google" à Google Webmaster Central.
Option 2: Supprimer Le Site De L'Index De Google Complètement
Avertissement! La méthode suivante va supprimer votre site de l'index de Google complètement. Ne l'utilisez que si vous ne voulez pas que votre site apparaisse dans les résultats de Google.
À éviter ("protéger") de votre site à partir d'arriver à le cache de Google, vous pouvez utiliser
robots.txt
. Pour obtenir des instructions sur la façon d'utiliser ce fichier, voir "Bloquer ou de supprimer des pages à l'aide d'un robots.txt fichier".En principe, vous devez créer un fichier nommé
robots.txt
et servir de votre dossier racine du site (/robots.txt
). Exemple de contenu de fichier:En outre, envisager de mettre en
robots
de la balise meta dans votre document HTML ànoindex
("À l'aide de balises meta pour bloquer l'accès à votre site"):<meta name="robots" content="noindex">
<meta name="googlebot" content="noindex">
Enfin, assurez-vous que vos paramètres de vraiment travailler, par exemple avec Google Outils Pour Les Webmasters.
Auriez-vous l'esprit la suppression de votre réponse? C'est totalement faux et pourrait induire les gens en erreur....
Je ne peux pas supprimer la réponse jusqu'à ce que l'on a accepté la réponse est changé.
J'ai proposé une modification. J'ai envie de montage pour mettre la bonne réponse est injuste pour dogbane
Merci pour le modifier. J'ai changé le type de réponse de la communauté wiki et fusionnés ma réponse avec la solution de @Dogbane à fournir plus d'une réponse complète.
OriginalL'auteur
Ajouter le tag HTML suivant dans la
<head>
section de vos pages web pour empêcher Google d'afficher le lien en Cache d'une page.Découvrez Google webmaster central | Meta tags pour voir ce que les autres balises meta Google comprend.
Si un bot fait ce qu'il veut, alors vous n'avez pas le choix.
C'est la réponse correcte. Tous les autres éviter que les sites indexés et trouvé dans les résultats de recherche. Ce n'est pas ce que l'utilisateur veut. Ils veulent juste pour empêcher la mise en cache et c'est exactement comment il est fait.
OriginalL'auteur dogbane
robots.txt: http://www.robotstxt.org/
OriginalL'auteur dynamic
Vous pouvez utiliser un
robots.txt
fichier à demander à ce que votre page n'est pas indexée. Google et d'autres les services réputés adhérer à cela, mais pas tous.La seule façon de s'assurer que le contenu de votre site n'est pas indexé ou mis en cache par aucun moteur de recherche ou un service similaire est pour empêcher l'accès au site, à moins que l'utilisateur dispose d'un mot de passe.
Ce qui est le plus facilement réalisé en utilisant HTTP Basic Auth. Si vous utilisez le serveur web Apache, il y a beaucoup de tutoriels (exemple) sur la façon de configurer ce. Une recherche bon terme à utiliser est
htpasswd
.OriginalL'auteur drewm
Une façon simple de le faire est avec un
<meta name="robots" content="noarchive"/>
Vous pouvez également obtenir un effet similaire avec l'robots.txt fichier.
Pour une bonne explication, voir le blog officiel de google sur le robot de l'exécution de la politique
OriginalL'auteur Simon Elliston Ball
Utiliser un système de connexion pour afficher le contenu.
Configurer
robots.txt
de refuser Google bot.OriginalL'auteur alex
Si vous voulez limiter les personnes qui peuvent voir le contenu, de le fixer derrière une certaine forme de mécanisme d'authentification (par exemple, protection par mot de passe, même si c'est juste HTTP Basic Auth).
Les détails de la façon de mettre cela en fonction sur les options offertes par votre serveur.
OriginalL'auteur Quentin
Vous pouvez également ajouter cet en-Tête HTTP de votre réponse, au lieu d'avoir besoin de mettre à jour les fichiers html:
par exemple pour Apache:
Voir aussi: https://developers.google.com/search/reference/robots_meta_tag?csw=1
OriginalL'auteur zeroimpl