générer des identifiants uniques dans la ruche

J'ai essayé de générer des identifiants uniques pour chaque ligne d'une table (30 m+ lignes).

  • à l'aide des numéros séquentiels évidemment pas ne fonctionne pas en raison de la nature parallèle de Hadoop.
  • le construit dans les UDFs rand() et dièse(rand(),unixtime()) semblent générer des collisions.

Il y a un moyen simple de générer des id de ligne, et je me demandais de quelqu'un a une solution.

  • ma prochaine étape, c'est la création d'un Java carte de réduire l'emploi de générer une véritable chaîne de hash avec une sécurité aléatoire + IP de l'hôte + heure actuelle comme une graine. mais je suppose que je vais demander ici avant de le faire 😉
  • Avez-vous envisagé de Uuid?
InformationsquelleAutor user1745713 | 2013-08-15