La PNL: Qualitativement “positif” et “négatif” de la phrase
J'ai besoin de votre aide pour déterminer la meilleure approche pour l'analyse spécifiques à l'industrie de phrases (c'est à dire des critiques de films) pour "positif" et "négatif". J'ai vu les bibliothèques comme OpenNLP avant, mais il est trop faible niveau, il me donne juste la phrase de base de la composition; ce que j'ai besoin c'est d'un niveau supérieur de la structure:
- espérons-le avec des listes de mots
- j'espère être travaillée sur mon jeu de données
Merci!
OriginalL'auteur Alex Weinstein | 2008-09-23
Vous devez vous connecter pour publier un commentaire.
Ce que vous cherchez est communément surnommé L'Analyse Des Sentiments. Généralement, l'analyse des sentiments n'est pas capable de gérer délicates subtilités, comme le sarcasme ou l'ironie, mais c'tarifs assez bien si vous lancez un grand ensemble de données.
L'analyse des sentiments généralement besoin d'un peu de pré-traitement. Au moins, la segmentation, la peine de limite de détection et une partie de la parole de marquage. Parfois, l'analyse syntaxique peut être important. Le faire correctement est toute une branche de la recherche en linguistique computationnelle, et je ne voudrais pas vous conseiller de venir avec votre propre solution, sauf si vous prenez votre temps pour étudier le terrain d'abord.
OpenNLP a certains outils d'aide à l'analyse des sentiments, mais si vous voulez quelque chose de plus grave, vous devriez regarder dans le LingPipe toolkit. Il a quelques intégré dans SA fonctionnalité et une belle tutoriel. Et vous pouvez vous entraîner sur votre propre jeu de données, mais ne pensez pas qu'il est tout à fait triviaux :-).
Googler le terme sera probablement aussi de vous donner quelques ressources pour travailler avec. Si vous avez des question plus spécifique, il suffit de demander, je suis à regarder la pnl-balise de près 😉
OriginalL'auteur Aleksandar Dimitrov
Certaines approches de l'analyse des sentiments des stratégies d'utilisation des populaire sur d'autres textes de classification des tâches. Le plus commun étant la transformation de votre film d'examen dans un vecteur de mot, et l'introduire dans un classificateur algorithme de données d'entraînement. Le plus populaire de l'exploration de données des paquets peut vous aider ici. Vous pourriez avoir un coup d'oeil à ce tutoriel sur le sentiment de classification illustrant la façon de faire une expérience à l'aide de l'open source RapidMiner toolkit.
D'ailleurs, il y a un bon jeu de données mis à disposition à des fins de recherche liées à la détection des avis sur des critiques de films. Il est basé sur IMDB, les critiques des utilisateurs, et vous pouvez vérifier plusieurs liés à des travaux de recherche sur la région et la façon dont ils utilisent l'ensemble de données.
Sa vaut la peine de garder à l'esprit que l'efficacité de ces méthodes ne peut être jugé qu'à partir d'un point de vue statistique, de sorte que vous pouvez très bien supposer qu'il y aura erreurs de classification et les cas où l'avis est difficile à détecter. Comme déjà remarqué dans ce fil, détection des choses comme l'ironie et le sarcasme peut être très difficile, en effet.
OriginalL'auteur bohana