Dictionnaire anglais txt ou xml fichier avec l'appui de synonymes
Quelqu'un peut-il m'indiquer où je peux le télécharger dictionnaire anglais comme un txt ou xml fichier. Je fais construire une application simple pour moi-même et à la recherche de quelque chose de ce que j'ai pu commencer à l'utiliser immédiatement, sans apprentissage complexe de l'API.
De soutien pour les synonymes serait génial, c'est qu'il devrait être plus facile à récupérer tous les synonymes pour un mot.
Il serait absolument fantastique, si le dictionnaire serait liste des Britanniques et des Américains de l'orthographe des mots là où ils diffèrent.
Même s'il est petit dictionnaire (quelques milliers de mots) c'est OK, j'ai seulement besoin d'elle pour un petit projet.
J'ai même serait prêt à l'acheter si le prix est raisonnable, et le dictionnaire est facile à utiliser - simple XML serait génial.
Toutes les directions s'il vous plaît.
- superuser.com/questions/120699/word-list-sources
- le Wiktionnaire peut être téléchargé au format XML mais il contient la mise en forme qui peut être douloureuse à analyser. Il comprend les synonymes et les variantes orthographiques.
- Trouvé une liste de fichiers csv sur github github.com/airshipcloud/dictionary-seed/tree/master/wordnet/...
Vous devez vous connecter pour publier un commentaire.
WordNet est ce que vous voulez. Il est grand, contenant plus d'une centaine de milliers d'entrées, et il est librement disponible.
Cependant, il n'est pas enregistré au format XML. Pour accéder aux données, vous aurez envie d'utiliser l'un de ces WordNet Api pour la langue de votre choix.
À l'aide de l'Api est généralement assez simple, donc je ne pense pas que vous ayez à vous soucier de "l'apprentissage (a) complexe d'API". Par exemple, l'emprunt auprès de la WordNet Comment pour le Python en fonction Natural Language Toolkit (NLTK):
Alors qu'il y a un anglais Américain biais dans WordNet, il prend en charge Britannique de l'orthographe et de l'utilisation. Par exemple, vous pouvez rechercher "couleur" et l'un des synsets pour "ascenseur' est 'ascenseur.n.01'.
Notes sur XML
Si le fait d'avoir les données représentées en XML est essentiel, vous pouvez facilement utiliser l'un de l'Api pour accéder à la WordNet
et de le convertir en XML, voir, par exemple,La pensée XML: Interrogation de WordNet comme XML.
Je sais que cette question est assez vieux, mais j'ai eu des problèmes moi-même pour la trouver que dans un fichier txt, donc si quelqu'un serait à la recherche de synonymes et d'antonymes txt fichier de base de données la plus simple et très détaillée de l'essayer
https://ia801407.us.archive.org/10/items/synonymsantonyms00ordwiala/synonymsantonyms00ordwiala_djvu.txt .
J'ai utilisé Roget de dictionnaire des synonymes dans le passé. Il a la synonymie des informations dans des fichiers de texte brut. Il existe également un code java pour vous aider à analyser le texte.
Ces pages fournit des liens vers un tas de thésaurus/ressources lexicales dont certains sont librement téléchargeables.
http://www.w3.org/2001/sw/Europe/reports/thes/thes_links.html
http://www-a2k.is.tokushima-u.ac.jp/member/kita/NLP/lex.html
Essayer WordNet.