Recherche dans la source html avec GOOGLE?
J'ai plusieurs sites web, et je ne me souviens pas où j'ai écrit quelques lignes de code. Que mes pages sont indexées par Google, je voudrais savoir si Google offre un service de recherche dans le code source HTML/mark-up lui-même, au lieu de seulement de permettre une recherche dans le visuel, le rendu, une partie d'une page?
Grâce
- Le code côté client ou le serveur?
- très facile avec nerdydata.com
Vous devez vous connecter pour publier un commentaire.
Il y a un nouveau moteur de recherche appelé NerdyData qui vous permet de rechercher sur le HTML/CSS/JS code source
Ils de l'indice de plus de 160 Millions de dollars dans les domaines publics et j'ai trouvé les données utiles.
Je suis venu à travers les ressources suivantes sur mes voyages (certains déjà mentionné ci-dessus):
HTML Mark-up axée moteurs de recherche
Je tiens également à jeter dans ce qui suit:
Énorme, site d'analyse de données des archives
Comment pouvons-nous analyser ces données d'analyse?
Pour avoir une idée de la façon de commencer l'analyse de certaines de ces données massives, jetez un oeil à Big Data/Map-reduce-type de cadres(s).
Google répertorie quelques idées sur l'utilisation d'Apache Spark projet pour analyser Commune d'Analyse de dump(s). Pour comprendre le format de fichier(s) utilisé par la Commune d'Analyse, reportez-vous à la suivante:
L'article, Accès Commun d'Analyse Dataset-sur-S3, décrit l'accès Commun d'Analyse de l'250TB+ dump(s) dans un faible coût manière sans de transfert de données charge en dehors d'Amazon AWS/S3 réseau. Bien sûr, cela suppose que vous sont va utiliser une combinaison AWS/EC2/S3 etc. pour analysise l'analyse des données.
Enfin, Patrick Durusau maintient certains intéressant de Common Crawl-utilisation liée à des pages du blog.
Personnellement, je trouve ce sujet intriguant, je suggère que nous obtenir cette analyse de données pendant qu'il est CHAUD! 😉
Vous pouvez essayer PublicWWW pour la recherche de la source/mark-up. Il permet de trouver tout le HTML, le JavaScript, le CSS et le texte en clair dans le code source de la page web sur 167 millions de sites web.
Avec PublicWWW vous pouvez:
De trouver des sites web grâce à l'unique code HTML qu'ils partagent, c'est à dire
widgets & identifiant d'éditeur.
Identifier les sites à l'aide de certaines images ou de badges.
Bien sûr, vous pouvez trouver non seulement vos sites web qui utilisent du code/mark-up extrait.
Google peut pas rechercher sur votre code de site.Yoy pouvez utiliser http://nerdydata.com/ Il est préférable de code de moteur de recherche que j'ai utilisé !
Je pense que vous obtiendrez votre code exact à partir de ce site.