pocketsphinx_continuous à partir de la version 0.8 a option -infile que vous pouvez utiliser pour décoder un fichier. Le fichier doit être dans un format spécifique: 16 khz 16 bits, mono wav fichier
pocketsphinx_continuous -infile file.wav
Merci pour votre réponse. Je ne vois pas ce -infile argument de l'homme de fichier. En outre, j'obtiens l'erreur suivante. FATAL_ERROR: "continue.c", la ligne 153: impossible de calibrer le détecteur d'activité vocale. J'ai le fichier d'entrée en 8k taux d'échantillonnage. Est ce que le problème? Oui, si vous voulez décoder 8 khz fichiers audio, vous devez ajouter une option '-samprate 8000'. Aussi, assurez-vous d'utiliser le bon modèle acoustique pour le son que vous essayez de décoder. Même avec samprate 8000, j'obtiens le même message d'erreur 🙁 "FATAL_ERROR: "continue.c", la ligne 153: impossible de calibrer le détecteur d'activité vocale" partager le fichier que vous essayez de reconnaître J'ai eu ce même problème, et il a été résolu par la création d'un fichier de plus grande taille, avec plus de silence au début. De ce que j'ai lu dans le Sphinx code, il semble que ce processus de calibrage est la calibration de ce silence et ce qui ne l'est pas. Depuis que j'ai eu un très petit fichier audio (seulement trois mots, une seconde environ), j'en ai déduit qu'il a besoin de plus de données pour "calibrer" le silence.
pocketsphinx_continuous
à partir de la version 0.8 a option-infile
que vous pouvez utiliser pour décoder un fichier. Le fichier doit être dans un format spécifique: 16 khz 16 bits, mono wav fichierOui, si vous voulez décoder 8 khz fichiers audio, vous devez ajouter une option '-samprate 8000'. Aussi, assurez-vous d'utiliser le bon modèle acoustique pour le son que vous essayez de décoder.
Même avec samprate 8000, j'obtiens le même message d'erreur 🙁 "FATAL_ERROR: "continue.c", la ligne 153: impossible de calibrer le détecteur d'activité vocale"
partager le fichier que vous essayez de reconnaître
J'ai eu ce même problème, et il a été résolu par la création d'un fichier de plus grande taille, avec plus de silence au début. De ce que j'ai lu dans le Sphinx code, il semble que ce processus de calibrage est la calibration de ce silence et ce qui ne l'est pas. Depuis que j'ai eu un très petit fichier audio (seulement trois mots, une seconde environ), j'en ai déduit qu'il a besoin de plus de données pour "calibrer" le silence.
OriginalL'auteur Nikolay Shmyrev