Hadoop Mapreduce plusieurs fichiers d'Entrée

J'ai donc besoin de deux fichiers en Entrée de mon mapreduce programme: de la Ville.dat et le Pays.dat

Dans ma méthode principale im analyse les arguments de ligne de commande comme ceci:

Path cityInputPath = new Path(args[0]);
Path countryInputPath = new Path(args[1]);
Path outputPath = new Path(args[2]);
MultipleInputs.addInputPath(job, countryInputPath, TextInputFormat.class, JoinCountryMapper.class);
MultipleInputs.addInputPath(job, cityInputPath, TextInputFormat.class, JoinCityMapper.class);
FileOutputFormat.setOutputPath(job, outputPath);

Si je suis maintenant en cours d'exécution de mon programme avec la commande suivante:

hadoop jar capital.jar org.myorg.Capital /user/cloudera/capital/input/City.dat /user/cloudera/capital/input/Country.dat /user/cloudera/capital/output

J'obtiens l'erreur suivante:

Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory /user/cloudera/capital/input/Country.dat already exists

Pourquoi faut-il traiter ce que mon répertoire de sortie? J'ai spécifié un autre répertoire que le répertoire de sortie. Quelqu'un peut-il m'expliquer cela?

Pouvez-vous s'il vous plaît changer la question titre qu'il confond la personne qui va par le biais de la question pour la première fois.

OriginalL'auteur gaussd | 2012-11-05