Bon jeu de données pour l'analyse des sentiments?
Je suis en train de travailler sur l'analyse des sentiments et je suis en utilisant dataset donné dans ce lien: http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html
et j'ai divisé mon jeu de données en ratio 50:50. 50% sont utilisés comme échantillons d'essai et 50% sont utilisés pour former des échantillons et les caractéristiques extraites à partir de former des échantillons et d'effectuer la classification à l'aide de Weka classificateur, mais ma prédication précision est d'environ 70 à 75%.
Quelqu'un peut-il suggérer quelques autres ensembles de données qui peut m'aider à augmenter le résultat - j'ai utilisé unigram, bigram et POStags que mes traits.
OriginalL'auteur user3512562 | 2014-07-07
Vous devez vous connecter pour publier un commentaire.
Il existe de nombreuses sources pour obtenir de l'analyse de sentiment dataset:
De toute façon, cela ne signifie pas qu'il vous aidera à obtenir une meilleure précision pour votre dataset parce que le corps peut être très différente à partir de votre jeu de données. En plus de réduire le pourcentage de tests vs de formation, vous pouvez: tester d'autres classificateurs ou d'affiner tous les hyperparameters aide semi-automatisée wrapper comme CVParameterSelection ou GridSearch, ou même auto-weka si il s'adapte.
Il est assez rare d'utiliser 50/50, 80/20 est assez fréquentes ratio. Une meilleure pratique consiste à utiliser: 60% pour la formation, 20% pour la validation croisée, 20% pour le test.
Il est assez rare d'utiliser 50/50, 80/20 est assez fréquentes ratio. Une meilleure pratique consiste à utiliser: 60% pour la formation, 20% pour la validation croisée, 20% pour le test. PS: je me souviens juste de cette énorme ngram dataset à partir de google storage.googleapis.com/books/ngrams/books/datasetsv2.html
Le texte suivant contient plus de 1,578,627 classés ensembles de données thinknook.com/wp-content/uploads/2012/09/... ou ai.stanford.edu/~amaas de données/sentiment/
OriginalL'auteur doxav
J'ai commencé à recueillir le sentiment des outils d'analyse/datasets/lexiques en un seul endroit, il pourrait être utile pour vous aussi: https://github.com/laugustyniak/awesome-sentiment-analysis
Commencer à RP si vous voulez ajouter quelque chose de plus ou juste m'écrire. J'ai beaucoup travaillé avec Amazon de données [millions de critiques].
OriginalL'auteur l.augustyniak
Voici une liste de jeux de données qui donne les sentiments par des mots..
http://positivewordsresearch.com/sentiment-analysis-resources/
Je vais essayer de mettre les liens ici si je reçois une chance
OriginalL'auteur Default picture