Comment extraire un géocodage de tweet dans un paquet twitteR dans R
Récemment Edwin Chen a affiché une grande carte de la régionale de l'utilisation de bicarbonate de soude vs pop vs coca-cola a créé à partir de géocodées tweets inolving ces mots dans le contexte de la consommation. http://blog.echen.me/2012/07/06/soda-vs-pop-with-twitter/
Il mentionne qu'il a utilisé le twitteR package créé par Jeff Gentry dans R. bien Sûr, il est facile de recueillir des tweets que l'utilisation d'un mot et les mettre dans un dataframe:
require(twitteR)
require(plyr)
cat.tweets<-searchTwitter("cats",n=1000)
tweets.df = ldply(cat.tweets, function(t) t$toDataFrame() )
le dataframe (tweets.df) contiendra l'id utilisateur, le tweet de texte, etc. pour chaque tweet, mais ne semble pas contenir le géocodage. Aucune idée sur la façon d'obtenir dans la R?
source d'informationauteur iantist
Vous devez vous connecter pour publier un commentaire.
Ne géocodage dire la longitude et la latitude de coordonnées?
Si oui, commandes suivantes fonctionne pour moi.
Source : LIEN
Ive été bricoler avec une fonction R, vous entrez dans le texte de la recherche, le nombre de sites de recherche, et le rayon autour de chaque site. Par exemple
twitterMap("#rstats",10,"10mi")
voici le code:Il y a des gros problèmes que j'ai rencontré que je ne suis pas sûr de la façon de traiter avec. Tout d'abord, comme l'écrit le code des recherches de 15 généré de façon aléatoire lieux, ces lieux sont générés à partir d'une distribution uniforme sur le maximum de longitude à l'est des états-unis pour le maximum de l'ouest, et de la latitude plus au nord à l'extrême sud. Cela comprendra des endroits qui ne sont pas aux états-unis, dire juste à l'est du lac des bois, dans le minnesota au Canada. Je voudrais une fonction qui au hasard vérifie pour voir si le générés emplacement est aux états-unis et la jeter si elle ne l'est pas. Plus important encore, je voudrais pour rechercher des milliers d'endroits, mais twitter n'aime pas et me donne un
420 error enhance your calm
. Alors peut-être il est préférable de rechercher toutes les quelques heures et lentement construire une base de données et supprimer les doublons de tweets. Enfin, si on choisit une distance sujet populaire, R donne une erreur commeError in function (type, msg, asError = TRUE) :
. Je suis un peu perplexe sur la façon de contourner ce problème.transfer closed with 43756 bytes remaining to read
Ici est un jouet exemple, étant donné que vous pouvez extraire seulement 100 tweets par appel:
Cette solution pourrait ne pas être trop élégant, mais j'ai été en mesure d'obtenir les tweets mis en particulier sur le géocodage.