Moderne, de haute performance filtre de bloom en Python?

Je suis à la recherche d'une qualité de production bloom filtre de mise en œuvre en Python pour manipuler un assez grand nombre d'éléments (dire 100M à 1B éléments avec 0,01% taux de faux positifs).

Pybloom est une option, mais il semble être à montrer son âge qu'il jette DeprecationWarning erreurs sur Python 2.5 sur une base régulière. Joe Gregorio a également une mise en œuvre.

Exigences de la recherche rapide de la performance et de la stabilité. Je suis aussi ouvert à la création d'interfaces Python particulièrement bon c/c++ implémentations, ou même à Jython si il y a une bonne implémentation de Java.

Manque que, des recommandations sur un tableau de bits /vecteur de bits de la représentation qui peut gérer ~16E9 bits?

  • D'intérêt, pouvez-vous nous expliquer quel est le problème avec les implémentations existantes (en particulier PyBloom)? Il peut être "long dans la dent", mais si cela fonctionne et n'a pas besoin de fixation, qui sonne comme un plus.
  • Oddthinking, mis à jour avec quelques explications.
InformationsquelleAutor Parand | 2008-11-22