Text-to-speech (voix génération) et de discours-à-texte (reconnaissance vocale) Api?
Est-il une liste complète des connus des Api pour le bureau ou navigateur environnements?
C'est une très vaste question. Êtes-vous intéressé par des Api ou des implémentations? Il n'existe aucun langage ou la plateforme de choix que vous pourriez faire pour limiter cela?
Je sais qu'il y a vraiment peu de bonnes solutions, j'ai donc décidé de choisir la plate-forme (au sens large) et langage de programmation basé sur la disponibilité d'un bon texte de synthèse de la parole et de la parole en texte.
Je sais qu'il y a vraiment peu de bonnes solutions, j'ai donc décidé de choisir la plate-forme (au sens large) et langage de programmation basé sur la disponibilité d'un bon texte de synthèse de la parole et de la parole en texte.
OriginalL'auteur Halst | 2011-06-14
Vous devez vous connecter pour publier un commentaire.
Je vais ressasser et de mettre à jour une réponse de La reconnaissance vocale dans le C ou le Java ou PHP?. Ce n'est en aucun cas exhaustive, mais cela pourrait être un début pour vous
De regarder ces questions depuis quelques mois, j'ai vu la plupart des développeur choix, se répartissent comme suit:
Les gens de Windows - utiliser le Système.Fonctionnalités de discours de .Net ou Microsoft.Discours et installer le logiciel gratuit Microsoft fournit des modules de reconnaissance. Windows 7 est équipée d'un moteur de reconnaissance vocale. D'autres sont téléchargeables gratuitement. Il y a une API C++ pour les mêmes moteurs connu comme SAPI. Voir à http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. ou http://msdn.microsoft.com/en-us/library/ms723627(v=vs. 85).aspx. Plus de fond sur les moteurs de Microsoft pour Windows
Quelle est la différence entre le Système.De la parole.La reconnaissance et Microsoft.De la parole.La reconnaissance?
Linux gens - Sphinx semble avoir une bonne suite. Voir http://cmusphinx.sourceforge.net/ et http://cmusphinx.sourceforge.net/wiki/
Produits commerciaux - Nuance, Loquendo, AT&T, IBM, les autres. Ont chacun leur propre Sdk et les bibliothèques pour les différentes langues.
Service en ligne,Nuance, Yapme, ispeech.org, vlingo, les autres. Nuance a amélioré leur programme de développeur et vous donne maintenant le libre accès à leurs services pour le développement. Yap (je crois) a été récemment acheté par Amazon, de sorte que nous pouvons voir quelques changements.
Bien sûr, cela peut aussi être utile - http://en.wikipedia.org/wiki/List_of_speech_recognition_software
Il y a un Java speech API. Voir javax.de la parole.la reconnaissance dans le Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html. Je crois que vous avez encore à trouver un moteur de reconnaissance vocale qui prend en charge cette API. Je ne pense pas que Sphinx prend entièrement en charge elle - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi
Il y a beaucoup d'autres quesitons:
Besoin de texte à la parole et les outils de reconnaissance pour Linux
et pyspeech (python) - Transcrire des fichiers mp3? qui parle http://code.google.com/p/pyspeech/. Vous pouvez également regarder http://code.google.com/p/dragonfly/
Je ne crois pas que Google jamais fait leur speech API accessible au public. Les gens ont l'ingénierie inverse et l'utiliser, mais je ne crois pas que Google le prend en charge pour la 3e partie de l'utiliser. Je crois qu'il est uniquement destiné à être utilisé par google Chrome navigateur ou système d'exploitation Android. Voir stackoverflow.com/a/12727910/90236 ou stackoverflow.com/a/7889565/90236
Google API est accessible gratuitement sur le Chrome. My web-app de mise en œuvre de celui-ci: speechlogger.appspot.com
OriginalL'auteur Michael Levy
Le leader de l'API vendeurs de texte à la parole (voix génération) sont YAKiToMe! et iSpeech. YAKiToMe! est celui que j'utilise parce que j'aime leurs voix de la qualité la meilleure et ils sont les moins chers (pour la plupart gratuites). Ils soutiennent les hommes et les femmes enceintes dans plusieurs langues. Certains de la voix des vendeurs, comme Acapella, Nuance, Loquendo et iVona ont décent de voix, mais ont tendance à être coûteux à utiliser.
OriginalL'auteur Richard
Ici est de savoir comment vous pouvez le faire:
Remarque: c'est une api de google, de sorte qu'il ne fonctionne que dans le navigateur chrome.
(Voir la démo en live et télécharger le code source complet ici http://purpledesign.in/blog/?p=33)
définir un bouton
et de définir ce que vous voulez faire dans une fonction dans votre fichier javascript
Comme Ce
Ici
Le discours est écrit dans le textarea
OriginalL'auteur Raj Sharma