Pocketsphinx - Ajout de mots et amélioration de la précision
J'ai réussi à enfin créer et d'exécuter des pocketsphinx (pocketsphinx_continuous). Le problème, je suis en cours d'exécution, est comment améliorer la précision. Ce que je comprends, vous pouvez spécifier un fichier de dictionnaire (-dict test.dic). J'ai donc pris le dictionnaire par défaut du fichier et l'ajout de quelques prononciations des mêmes mots, par exemple:
pencil P EH N S AH L
pencil(2) P EH N S IH L
spaghetti S P AH G EH T IY
spaghetti(2) S P UH G EH T IY
Encore pocketsphinx ne reconnaît toujours pas, soit le mot à tous. Je sais qu'il est un jsgf fichier, vous pouvez spécifier en tant que bien , mais cela semble de plus en plus de phrases et la grammaire. Comment puis-je obtenir pocketsphinx à reconnaître les mots courants tels que le crayon et le spaghetti?
grâce
-Mike
source d'informationauteur Mike6679
Vous devez vous connecter pour publier un commentaire.
Avec quelque chose comme cela, vous ne pouvez pas être certain, mais je peux offrir les suggestions suivantes:
Peut-être le modèle de langue en quelque sorte a une faible probabilité pour que les "spaghetti" et "crayon". Comme vous l'avez suggéré, vous pouvez utiliser un JSGF de tester la façon dont il le fait pour la reconnaissance si elle n'utilise pas le N-gramme modèles, mais plutôt un simple grammaire (le donner comme une vingtaine de mots, y compris les spaghetti et un crayon). De cette façon, vous pouvez voir si il est peut-être le modèle de langue qui rend difficile de reconnaître ces mots, et il peut faire du bien si elle tient compte de tous les mots ont la même probabilité.
Peut-être il vous suffit de prononcer ces mots mal, même avec les autres entrées du dictionnaire. Essayez de A. Tester d'autres voix des peuples, ou B. l'Adaptation du modèle acoustique de votre voix (voir http://cmusphinx.sourceforge.net/wiki/tutorialam)
Aussi, qu'est-il reconnaître que lorsqu'il est défectueux? Si possible, supprimer les mots il misrecognizes qu'à partir du dictionnaire.
Encore une fois, pour l'ensemble de la précision, seulement trois choses vont vraiment vous aider: la restriction de la grammaire, de l'adaptation à l'acoustique du modèle, et peut-être obtenir une meilleure qualité d'enregistrement d'entrée.
À améliorer la précision, vous pouvez essayer d'adapter le modèle acoustique de votre voix.
http://cmusphinx.sourceforge.net/wiki/tutorialadapt
Pour savoir comment ajouter de nouveaux mots: http://ghatage.com/tech/2012/12/13/Make-Pocketsphinx-recognize-new-words/
Assurez-vous de mettre un onglet (pas d'espace) après le mot, et avant le début de la prononciation.
Peut-être le problème est avec Pocketsphinx. Moi aussi je n'était pas d'obtenir de bons résultats avec Pocketsphinx. Mais j'étais très bonne précision avec Sphinx4 (pour un haut-parleur avec un microphone anti-bruit.) Donc j'ai fait une comparaison entre les deux en utilisant les mêmes enregistrements audio. Pour pocketsphinx j'ai utilisé pocketsphinx_batch avec le WSJ audio modèle et un peu de vocabulaire modèle de langue et dictionnaire (créé en ligne avec la CMU Cambridge langage de modélisation de la boîte à outils.) Pour Sphinx4 j'ai écrit un petit programme en Java à l'aide de la Sphinx4 de la bibliothèque. Le résultat a été que Sphinx4 a été beaucoup plus précis. Tous les détails sanglants sont à http://www.jaivox.com/pocketsphinx.html.