Temps réel de la reconnaissance vocale à l'aide de WebRTC, Node.js et le moteur de reconnaissance vocale

A. Ce que je suis en train de mettre en œuvre.

Une application web permettant en temps réel de la reconnaissance vocale à l'intérieur de navigateur web (comme cette).

B. Technologies, je suis actuellement à la pensée de l'aide pour atteindre A.

  • JavaScript
  • Node.js
  • WebRTC
  • Microsoft Speech API ou Pocketsphinx.js ou quelque chose d'autre (on ne peut pas utiliser le Web Speech API)

C. Très flux de production de base

  1. Navigateur établit une connexion à un Nœud de serveur (serveur agit comme un serveur signalisation et sert également des fichiers statiques)
  2. Navigateur Web acquiert flux audio à l'aide de getUserMedia() et envoie des voix de l'utilisateur pour le Nœud serveur
  3. Nœud serveur transmet le flux audio reçu à moteur de reconnaissance vocale pour l'analyse
  4. Moteur de reconnaissance vocale de retours suite à un Nœud de serveur
  5. Nœud serveur envoie le texte résultat en lançant le navigateur web
  6. (Node server effectue les étapes 1 à 5 pour traiter les demandes à partir d'autres navigateurs)

D. Questions

  1. Serait Node.js être adéquate pour atteindre les C?
  2. Comment ai-je pu passer a reçu des flux audio à partir de mon serveur de Nœud à un moteur de reconnaissance vocale fonctionnant séparément à partir du serveur?
  3. Mon moteur de reconnaissance vocale être en cours d'exécution comme un autre Nœud de l'application (si j'utilise Pocketsphinx)? Donc, mon Nœud de serveur communique à mon Nœud de la reconnaissance vocale du serveur.
le code source derrière votre lien est : src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech vous pouvez regarder la façon dont ILS mettent en œuvre pour informer votre architecture??

OriginalL'auteur jpen | 2014-06-01