Peut hadoop prendre l'entrée de plusieurs répertoires et des fichiers
Que j'ai mis le fileinputFormat que hadoop d'entrée.
Le arg[0]+"/*/*/*"
dit correspondent à aucun des fichiers.
ce que je veux, c'est de lire à partir de plusieurs fichiers comme:
Directory1 ---Directory11 ---Directory111 --f1.txt --f2.txt ---Annuaire12 Directory2 ---Directory21
est-il possible dans Hadoop?
Merci!
Vous devez vous connecter pour publier un commentaire.
Vous pouvez prendre l'entrée de plusieurs répertoires et fichiers à l'aide de la ***** l'opérateur. Le plus probable, c'est parce que la "arg[0]" l'argument n'est pas valable et par conséquent, il n'est pas de trouver les fichiers.
Comme alternative, vous pouvez également utiliser InputFormat.addInputPath ou si vous avez besoin de séparer les formats ou les mappeurs de la MultipleInputs classe peut être utilisée.
Exemple de base de l'ajout d'un chemin
Voici un exemple de MultipleInputs
Cette autre question est également très similaire et a de bonnes réponses, Hadoop afin de réduire de plusieurs formats d'entrée.
arg[0] + "/*/*/*/"
doit être " arg[0]+"/*/*/*", - ne correspondent à aucune des fichiers? et je crois javax.le courrier peut être utilisé, mais je ne sais pas vraiment