Comment intégrer les R dans une application web

Je développe une application web et je voudrais effectuer deux types de statistiques/les opérations de modélisation.

(1) analyse des Lots à partir de données stockées dans le backend de mon application (cluster HBase). Généralement, cette opération doit être effectuée sur une base régulière, dire tous les soirs. La taille des données peut dépasser ce qui peut être stockée dans la mémoire locale, de sorte que ce pourrait avoir besoin de l'invocation d'un paquet de soutien de calcul parallèle.
(2) À la volée R l'exécution est déclenchée par une demande de l'utilisateur dans le front-end. Cas d'utilisation typique comprennent les prévisions de petites séries. Les utilisateurs peuvent placer des demandes dans le même temps, il devrait donc y avoir un certain appui pour la concurrence. La performance est d'une importance capitale, car l'utilisateur ne peut pas attendre indéfiniment pour la réponse à venir.

Ma question est : quelle serait la meilleure combinaison de technologies/CRAN package pour résoudre ces deux problèmes ?
Mon idée pour le moment est :

  • À l'aide de Rserver en combinaison avec un Rubis client. Sinon, je pense à écrire moi-même le serveur en Java et utilisant les R/Java les liaisons.
  • À l'aide de RHadoop gérer les tâches sur de gros ensembles de données.

J'ai vu RevoDeployR est un excellent outil, mais n'est pas open source, n'est-ce pas ?

Merci pour votre aide

OriginalL'auteur Benoit Guigal | 2012-10-22