La langue à utiliser pour Hadoop Map/reduce programmes? Java ou PHP?
J'ai écrit récemment un couple de map/reduce programmes en java. Mais je sais aussi que le langage de script comme php peut également être utilisé. Cependant, presque tout le monde recommande de java ou python. Je travaille actuellement en php. Donc, je me demandais quelle langue est mieux adapté pour le map/reduce programme de développement?
Un inconvénient majeur de php pour map/reduce mise en œuvre, c'est que, il n'est pas multi-thread.
Aussi que, hadoop a une vaste cadre de classes, interfaces et méthodes spécialement en java, php programmes ne peuvent pas se prévaloir. Et aussi que php n'est pas conçu pour gérer de fortes traitement des données de la tâche.
Si quelqu'un peut me dire dans de larges points qui choisir comme une arme de choix pour les map/reduce mise en œuvre?
ok, vous peut-être raison. mais quel définitif de la bonne ou de la mauvaise utilisation de php pour cette tâche? Parce que, maintenant, pour la facilité de programmation, si je choisis php, dans le long terme, il ne devrait pas arriver qu'il y aura des problèmes d'évolutivité avec php ou d'autres problèmes. Pensez-vous avoir une telle idée? Pouvez-vous me fournir ces liens qui pourront vous être utiles?
Qu'en java vs python pour l'apprentissage hadoop/mapreduce?
JavaScript est bon pour hadoop?
OriginalL'auteur Shades88 | 2011-12-20
Vous devez vous connecter pour publier un commentaire.
shanthanu, votre première question est
Q) langage de script qui est bon pour hadoop?
A) la Plupart des langages de script tels que php, python, perl, ruby, bash est bon. N'importe quelle langue en mesure de lire à partir de stdin, écrire à sdtout et onglet analyse et de caractères de nouvelle ligne: Hadoop Streaming juste pipes à la chaîne des représentations de paires clé-valeur en tant que concaténé avec un onglet à l'arbitraire d'un programme qui doit être exécutable sur chaque tâche tracker nœud.
Sur la plupart des distributions linux utilisé pour la configuration des clusters hadoop, python, bash, ruby, perl... sont déjà installé, mais rien n'empêchera de rouler votre propre environnement d'exécution de votre script favori ou compilé en langage de programmation.
Q) de PHP n'est pas multithread?
A) oui, mais, il existe des moyens par lesquels nous pouvons faire de PHP multi-thread. Utiliser, par exemple: pnctl_fork (), (mais, cela ne fonctionne pas dans windows)
La question qui vous devez conserver toujours à l'esprit avant d'aller pour les langages de script avec hadoop n'est pas "qui langage de script?" parce que tout est ok.
Mais, la différence entre java et le langage de script, il est "Battement de Cœur d'enfant nœuds ne seront pas envoyés à l'nœuds parents lorsque nous sommes à l'aide de langages de script".
OriginalL'auteur shiva kumar s