Comparer la similarité des termes/expressions à l'aide de NLTK?
Je suis en train de comparer les termes/expressions qui serait (ou pas) être reliés sémantiquement - ce ne sont pas des phrases complètes, et pas nécessairement des mots simples; par exemple, -
De "service de réseautage Social" et de "réseau Social" sont clairement fortement lié, mais comment je les quantifier à l'aide de nltk?
Est clair que je suis absent quelque chose que même le code:
w1 = wordnet.synsets('social network')
retourne une liste vide.
Des conseils sur la façon de remédier à cette situation?
essayez de github.com/alvations/pywsd
OriginalL'auteur GG_Python | 2013-06-01
Vous devez vous connecter pour publier un commentaire.
Il y a quelques mesures de proximité sémantique ou de la similitude, mais ils sont mieux définis pour des mots ou expressions uniques dans wordnet du lexique - pas pour les composés de wordnet est des entrées lexicales, autant que je sache.
C'est une belle web de mise en œuvre de beaucoup de similitudes wordnet mesures fondées sur le
Certains plus de lecture sur l'interprétation des composés à l'aide de wordnet similitude (mais pas de l'évaluation de la similarité sur les composés), si vous êtes intéressé:
OriginalL'auteur arturomp
Voici une solution que vous pouvez utiliser.
w1 et w2 aura un tableau de synsets. Trouver la similitude entre chaque synset de w1 à w2. L'un avec un maximum de similarité de vous donner combiné synset (qui est ce que vous cherchez).
Voici le code complet
Si vous voyez simindex[0,0] est la valeur max 0.46153846 donc xsyn[0] et ysyn[0] semble être le mieux décrire
w1 = wordnet.synsets('social network')
vous pouvez le voir avec la définition.OriginalL'auteur Somum
https://www.mashape.com/amtera/esa-semantic-relatedness
C'est une API web pour calculer la proximité sémantique entre deux mots ou des extraits de textes..
OriginalL'auteur Leo
résultat
OriginalL'auteur eyquem
Peut-être que tu aurais besoin d'un WSD module qui permettrait le retour d'un wordnet
Synset
objet de NLTK. Si oui, vous pouvez prendre un coup d'oeil à ceci: https://github.com/alvations/pywsd[out]:
OriginalL'auteur alvas