Comparaison de Fichiers HDFS

Comment puis-je comparer deux fichiers HDFS puisqu'il n'est pas diff?

Je pensais de l'aide de la Ruche tables et de chargement de données à partir de HDFS et ensuite à l'aide d'adhérer à des déclarations sur les 2 tableaux. Est-il une meilleure approche?

Quelle est la version d'hadoop utilisez-vous? Êtes-vous à l'aide d'un CDH distro?

OriginalL'auteur ftw | 2013-01-23