résumer le texte ou de simplifier le texte
Est-il de la bibliothèque, de préférence en python, mais au moins open source, qui peut résumer et ou la simplification de langage naturel de texte?
- Il y a une autre bibliothèque qui est basé sur le "TextRank' algorithme que vous pouvez trouver ici. github.com/RaRe-Technologies/gensim
- Il y a à peine n'importe quel programme qui peut le faire.
Vous devez vous connecter pour publier un commentaire.
Je ne suis pas sûr si il n'y a actuellement aucune bibliothèques qui font cela, en tant que texte de synthèse, ou au moins compréhensible texte de synthèse n'est pas quelque chose qui va être facilement accompli par un simple plug & play bibliothèque.
Voici quelques liens que j'ai pu trouver concernant les projets /ressources qui sont liées au texte de synthèse pour vous aider à démarrer:
Espère que cela aide 🙂
Peut-être vous pouvez essayer la région de soumy. C'est une assez petite bibliothèque que j'ai écrit en Python. Il y a mis en œuvre Luhn et Edmundson approches, LSA méthode, SumBasic, KL-Somme, LexRank et TextRank algorithmes. C'est Apache2 sous licence et prend en charge le tchèque, le slovaque, l'anglais, le français, le Japonais, le Chinois, le portugais, l'espagnol et l'allemand.
N'hésitez pas à ouvrir une question ou demander un pull si il ya quelque chose que vous êtes absent.
LSA
la plus récente de la langue naturelle de la méthodologie et théoriquement le meilleur par rapport aux autres options?J'ai aussi la même chose, mais je ne pouvais pas trouver quoi que ce soit dans Python qui m'a aidé à avoir un Complet Résultat.
J'ai donc trouvé ce Web Service vraiment utile, et ils ont un libre API qui donne un résultat JSON, et je voulais la partager avec vous.
Découvrez-le ici: http://smmry.com
Pas python, mais MEAD fera le texte de synthèse (en Perl). Généralement ce qui arrive est compréhensible, si ce n'est pas toujours particulièrement fluide de sondage. Consultez également summarization.com pour un grand nombre d'informations sur le texte de la synthèse de la tâche.
Essayer Texte Ouvrir L'Outil De Synthèse qui est publié sous la licence open source GPL. Il fonctionne raisonnablement bien, mais il n'y a pas eu de travaux de développement depuis 2007.
Le code original est écrit en C (à la fois une bibliothèque et un utilitaire de ligne de commande), mais il y a des wrappers dans un certain nombre de langues:
Prendre un coup d'oeil à ce l'article qui fait une étude détaillée de ces méthodes et des paquets:
La fin de l'article fait un 'résumé'.
L'auteur de la région de soumy @le miso.belica a donné une description dans une réponse ci-dessus.
Diverses autres techniques de blanchiment d'argent ont augmenté, comme Facebook/MAAN et Google/TextSum mais ont encore besoin d'une formation approfondie en Gigaword Dataset et environ 7000 GPU heures. Le jeu de données elle-même est assez coûteux.
En conclusion, je dirais que la région de soumy est la meilleure option sur le marché dès maintenant si vous n'avez pas accès à des machines haut de gamme. Merci beaucoup @miso.belica pour ce merveilleux colis.
A quelques temps, j'ai écrit un résumé de la bibliothèque pour python à l'aide de NLTK, à l'aide d'un algorithme à partir de la Classifier4J de la bibliothèque. C'est assez simple, mais il peut répondre aux besoins de toute personne qui a besoin de synthèse: https://github.com/thavelick/summarize