Comment former l'outil d'analyse de sentiment PNL de Stanford

L'enfer tout le monde! Je suis à l'aide de la Stanford de Base de la PNL paquet et mon objectif est d'effectuer l'analyse des sentiments sur un flux de tweets.

À l'aide de l'analyse de sentiment de l'outil est renvoie une très mauvaise analyse de texte de "l'attitude" .. beaucoup de points positifs sont étiquetés neutre, de nombreux aspects négatifs nominale positive. Je suis allé de l'avant un acquis de plus d'un million de tweets dans un fichier texte, mais je n'ai pas la moindre idée de comment fait train l'outil et de créer mon propre modèle.

Lien de Stanford, l'Analyse des Sentiments page

"Modèles peuvent être recyclés à l'aide de la commande suivante à l'aide de la PTB format dataset:"

java -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath     dev.txt -train -model model.ser.gz

Échantillon de dev.txt (4 représente la polarité de 5 ... 4/5 positif)

(4 (4 (2 A) (4 (3 (3 warm) (2 ,)) (3 funny))) (3 (2 ,) (3 (4 (4 engaging) (2 film)) (2 .))))

Échantillon de test.txt

(3 (3 (2 If) (3 (2 you) (3 (2 sometimes) (2 (2 like) (3 (2 to) (3 (3 (2 go) (2 (2 to) (2 (2 the) (2 movies)))) (3 (2 to) (3 (2 have) (4 fun))))))))) (2 (2 ,) (2 (2 Wasabi) (3 (3 (2 is) (2 (2 a) (2 (3 good) (2 (2 place) (2 (2 to) (2 start)))))) (2 .)))))

Échantillon de train.txt

(3 (2 (2 The) (2 Rock)) (4 (3 (2 is) (4 (2 destined) (2 (2 (2 (2 (2 to) (2 (2 be) (2 (2 the) (2 (2 21st) (2 (2 (2 Century) (2 's)) (2 (3 new) (2 (2 ``) (2 Conan)))))))) (2 '')) (2 and)) (3 (2 that) (3 (2 he) (3 (2 's) (3 (2 going) (3 (2 to) (4 (3 (2 make) (3 (3 (2 a) (3 splash)) (2 (2 even) (3 greater)))) (2 (2 than) (2 (2 (2 (2 (1 (2 Arnold) (2 Schwarzenegger)) (2 ,)) (2 (2 Jean-Claud) (2 (2 Van) (2 Damme)))) (2 or)) (2 (2 Steven) (2 Segal))))))))))))) (2 .)))

J'ai deux questions à l'avenir.

Quelle est la signification et de la différence entre chaque fichier? Train.txt/Dev.txt/Test.txt ?

Comment puis-je former mon propre modèle avec un son brut, unparsed fichier texte plein de tweets?

Je suis très nouveau à la PNL donc, si je suis absent de toute information requise ou quoi que ce soit, veuillez critique! Merci!!!!

source d'informationauteur Jordan H