Quel est le moyen le plus rapide pour vérifier si les fichiers sont identiques?

Si vous avez 1,000,0000 fichiers source, vous pensez qu'ils sont tous les mêmes, et que vous voulez comparer, ce qui est le courant à jeun méthode pour comparer ces fichiers? Supposons qu'ils sont les fichiers Java et de la plateforme où la comparaison est faite n'est pas important. cksum est de me faire pleurer. Quand je veux dire identiques je veux dire, TOUTES identiques.

Mise à jour: - je savoir sur la génération de sommes de contrôle. diff est risible ... je veux de la vitesse.

Mise à jour: Ne restez pas coincé sur le fait qu'ils sont des fichiers source. Prétendre par exemple que vous avez pris un million de pistes d'un programme avec de très réglementé de sortie. Vous voulez prouver à tous les 1 000 000 de versions de la sortie sont les mêmes.

Mise à jour: lire le nombre de blocs plutôt qu'en octets? Immédiatement jeter ceux-là? Est que plus rapide que de trouver le nombre d'octets?

Mise à jour: Est-ce si différent de la façon la plus rapide pour comparer deux fichiers?

  • diff est risible seulement parce que c'est le mauvais outil, il vous donne calculé les différences. Si vous voulez simplement savoir si les deux fichiers sont identiques, l'utilisation du cpm.
  • 1,000,0000 fichiers source, comparer, j'ai juste ne suis pas en mesure de visualiser l'endroit où 1 Million de fichiers source sont utilisés.
  • Vous dire que ce sont les fichiers Java. Avez-vous besoin d'un outil qui peut aussi ignorer les espaces et les différences de mise en forme?
  • Disons que vous exécutez un programme d'un million de fois... absolue de la même ness est nécessaire... Vous voulez comparer des millions de produits différents...
  • Utiliser des threads... zoundsss d'entre eux.
InformationsquelleAutor ojblass | 2009-04-24