Comment télécharger les résultats de recherche sur google scholar à l'aide de r?
Je voudrais extraire les 100 premiers résultats (dire) d'une recherche sur Google Scholar à l'aide de R. personne Ne sait comment le faire?
Pour être précis, j'ai juste besoin du nom du livre, des auteurs et de citations comte.
Ps Serait-ce légal?
Il ressemble à Google scholar est le manque de nice API
Re PS: j'ai regardé la page "à propos" (scholar.google.ca/intl/en/scholar/about.html) et je ne vois pas de manière explicite les conditions d'utilisation
Aussi tonybreyal.wordpress.com/2011/11/08/...
Et la mise à jour: tonybreyal.wordpress.com/2011/11/08/...
Non pas une stricte réponse, mais je suggère de l'apprentissage de Python pour le web scraping tâches. Même si vous ne prévoyez pas de l'utiliser pour les statistiques de la programmation, c'est juste beaucoup plus facile pour gratter dans mon expérience, et a plus de références que vous pouvez utiliser. J'ai passé le temps de l'apprendre sur le dessus de R, et certainement ne pense pas que c'était une perte de temps.
Re PS: j'ai regardé la page "à propos" (scholar.google.ca/intl/en/scholar/about.html) et je ne vois pas de manière explicite les conditions d'utilisation
Aussi tonybreyal.wordpress.com/2011/11/08/...
Et la mise à jour: tonybreyal.wordpress.com/2011/11/08/...
Non pas une stricte réponse, mais je suggère de l'apprentissage de Python pour le web scraping tâches. Même si vous ne prévoyez pas de l'utiliser pour les statistiques de la programmation, c'est juste beaucoup plus facile pour gratter dans mon expérience, et a plus de références que vous pouvez utiliser. J'ai passé le temps de l'apprendre sur le dessus de R, et certainement ne pense pas que c'était une perte de temps.
OriginalL'auteur Manoel Galdino | 2011-02-15
Vous devez vous connecter pour publier un commentaire.
veuillez prendre en compte les mises à jour biobucket-post:
http://thebiobucket.blogspot.com/2011/11/r-function-google-scholar-webscraper.html
peut-on changer le vote pour pointer vers une solution actuelle?
OriginalL'auteur Kay
Il y a quelques Python et Perl grattoirs là-bas que vous pourriez être en mesure de s'adapter, lié à http://bmb-common.blogspot.com/2011/02/does-google-scholar-suck-or-am-i-just.html
OriginalL'auteur Ben Bolker
Je ne peux pas parler à la légalité de votre tâche, mais il existe quelques façons dont vous pouvez aller à ce sujet. Alors que je ne suis pas forte en XPath, il peut être le meilleur moyen. Je crois que vous pouvez utiliser le paquet XML pour récupérer le contenu de la page et l'utilisation de XPath pour extraire les données des éléments dont vous avez besoin.
Par exemple, j'utilise Chrome, un navigateur, et quand j'ai inspecté la page avec les Outils de développement, il ne semble pas être une structure de la page, avec les données "cachées" à l'intérieur de diverses balises qui doivent vous être en mesure d'exploiter très facilement à l'aide de XPath.
Découvrez ce lien pour un exemple d'utilisation de XPath.
HTH et Bonne Chance
OriginalL'auteur Btibert3
Vous pouvez certainement récupérer le contenu HTML de la page à l'aide de RCurl et les analyser à l'aide de RXML comme suggéré par Btibert3.
La seule question que vous pourriez faire face est que Google ne vous permettra pas de faire des requêtes dans un "robotique". Après quelque chose comme 200 requêtes dans Google dans un court laps de temps, il ne renvoie pas les résultats plus. Peut-être que c'est différent avec Google Scholar, mais je doute donc...
OriginalL'auteur Jean-Robert
Une solution a été récemment publié ici:
http://thebiobucket.blogspot.com/2011/11/visually-examine-google-scholar-search.html
OriginalL'auteur Tal Galili