Twitter (réseau Social) Dataset
Je suis à la recherche de twitter ou d'autres sites de réseautage social dataset pour mon projet. J'ai actuellement la section 2.0 twitter dataset, mais il ne contient que les tweets des utilisateurs. Je veux de données qui indique le nombre d'amis, le disciple et le de telles.
Il n'a pas twitter mais je préfère que twitter ou facebook. J'ai déjà essayé infochimps mais apparemment, le fichier n'est pas téléchargeable plus pour twitter.
Quelqu'un peut me donner des bons sites web pour trouver ce type d'ensemble de données. Je vais nourrir l'ensemble de données de hadoop.
OriginalL'auteur denniss | 2010-07-27
Vous devez vous connecter pour publier un commentaire.
Essayer les trois ensembles de données:
Contient environ 97 millions de tweets:
http://demeter.inf.ed.ac.uk/index.php?option=com_content&view=article&id=2:test-post-for-twitter&catid=1:twitter&Itemid=2ndlr: l'ensemble de données précédemment lié ci-dessus n'est plus disponible en raison d'une demande de Twitter pour l'enlever.
Contient utilisateur graphique de 47 millions d'utilisateurs:
http://an.kaist.ac.kr/traces/WWW2010.html
Suivant jeu de données contient le réseau, ainsi que des tweets, cependant, les données ont été recueillies par échantillonnage en boule de neige ou quelque chose où le réseau d'amis n'est pas uniforme. Il a autour de 10 millions de tweets, vous pouvez envoyer un mail au chercheur pour encore plus de données.
http://www.public.asu.edu/~mdechoud/datasets.html
Bien avoir un coup d'oeil à la licence de distribution des données en vertu de l'.
Espère que cette aide,
Aussi pouvez-vous me dire quel genre de travail de planification avec ce jeu de données?
J'ai quelques hadoop /scripts pig à utiliser avec dataset
Bhat: Ils semblent avoir retiré les ensembles de données d'aujourd'hui. Auriez-vous par hasard à connaître tous les autres ensembles de données qui pourraient être disponibles? Merci!!!!
OriginalL'auteur
100 millions de pages ont été extraites à partir de facebook :
http://it.slashdot.org/story/10/07/28/1350222/100-Million-Facebook-Pages-Leaked-On-Torrent-Site?art_pos=6
Je ne sais pas ce qu'ils contiennent, mais vous pourriez avoir un coup d'oeil, il semble qu'il est facile à trouver sur les sites de torrents.
Vous pouvez également utiliser le facebook de l'API, mais si vous voulez un ensemble de données assez grand, il aurait fallu demander à facebook les droits pour y accéder.
Il contient des liens à des amis, des goûts, des groupes, ...
oui j'ai vu cela. merci bien
bizarre comment je n'ai pas gagner le bounty
OriginalL'auteur Scharron
Facebook graphe social, les installations d'applications et le Dernier.fm utilisateurs, des événements, des groupes recueillies par les chercheurs à UCIrvine: http://odysseas.calit2.uci.edu/research/
OriginalL'auteur pbx
Je pense que le meilleur outil pour twitter de collecte de données est http://www.followthehashtag.com , il peut obtenir l'historique ou de données à l'avenir et avec l'avancée des données fonctions d'export
Avec une section où nous ajouter des ensembles de données volumineux (environ 200 000 tweets) une fois par semaine
http://followthehashtag.com/datasets/
OriginalL'auteur Enrique R Rivera