HashMap mise en œuvre en Java. Comment le seau de calcul de l'indice de travail?

Je suis à la recherche à la mise en œuvre de HashMap en Java et je suis coincé à un moment donné.

Comment est la indexFor fonction est-elle calculée?

static int indexFor(int h, int length) {
   return h & (length-1);
}

Grâce

InformationsquelleAutor gnreddy | 2012-06-04

hashmap java

32

Ce n'est pas le calcul de la de hachage, c'est le calcul de la seau.

L'expression h & (length-1) fait un peu sage AND sur h à l'aide de length-1, qui est comme un masque de bits, pour ne retourner que les bits de bas de h, ce qui rend pour un super-rapide variante de h % length.
- Pouvez-vous nous expliquer ce calcul ici ?
- Est-ce à supposer que length est une puissance de 2?
- Eh bien, il serait beaucoup mieux si elle était une puissance de 2, alors vous devez obtenir une coupe nette hors de la haute-bits. Il se trouve que la mise en œuvre de la HashMap commence avec une taille de 16 et, en effet, de multiplier par deux lors d'un redimensionnement. Il fonctionne encore si ce n'est une puissance de deux, mais vous ne souhaitez que nombre de bits "sur" que possible pour length -1 à la solde de l'écart entre les seaux
InformationsquelleAutor Bohemian
101

Le hachage est lui-même calculé par le hashCode() méthode de l'objet que vous essayez de magasin.

Ce que vous voyez ici est le calcul de la "seau" pour stocker l'objet basé sur le hachage h. Idéalement, pour éviter les collisions, vous avez le même nombre de compartiments comme c'est le maximum réalisable valeur de h - mais qui pourrait être trop gourmandes en mémoire. Par conséquent, vous ont généralement un faible nombre de compartiments avec un danger de collision.

Si h est, disons, 1000, mais vous avez seulement 512 seaux dans votre sous-jacente de tableau, vous devez savoir où placer l'objet. Généralement, un mod opération sur h serait suffisant, mais c'est trop lent. Compte tenu de la propriété interne de HashMap que le sous-jacent de la matrice de toujours a nombre de compartiments égal à 2^n du Soleil, les ingénieurs ont pu utiliser l'idée de h & (length-1), il fait un au niveau du bit ET avec un nombre composé de tous 1's, pratiquement lecture seulement le n plus bas les bits de la table de hachage (qui est le même que le fait de faire h mod 2^n, seulement beaucoup plus rapide).

Exemple:
```
     hash h: 11 1110 1000  -- (1000 in decimal)
   length l: 10 0000 0000  -- ( 512 in decimal)
      (l-1): 01 1111 1111  -- ( 511 in decimal - it will always be all ONEs)
h AND (l-1): 01 1110 1000  -- ( 488 in decimal which is a result of 1000 mod 512)
```
- Est-il un sens aujourd'hui, ou devrais-je donner plus de détails sur le fonctionnement interne?
- Très bien expliqué. Je suis impressionné.
- eu .... merci
- Je suis content d'avoir pu aider.
- Incroyable explication
- Est-ce à dire qu'un compartiment de hachage pourrait contenir les touches avec différents hashCodes si le plus bas 9 ou si les bits d'accord, mais les bits supérieurs sont-ils différents?
- Oui, c'est correct. C'est l'une des principales raisons pour lesquelles un good hash function la multiplie le résultat par un nombre premier - il essaie d'obtenir des résultats très différents de hachages, même lorsque les valeurs diffèrent un peu.
- Je vous remercie. C'est l'une des meilleures réponses que j'ai vu sur DONC. (+1).
- impressionnant,merci
- La meilleure explication du seau de calcul sur le web. Merci beaucoup!
InformationsquelleAutor Petr Janeček
2

Il est en train de calculer le seau de la table de hachage de la carte où l'entrée (paire clé-valeur) seront stockées. Le seau id est hashvalue/buckets length.

Un hachage carte se compose de seaux; les objets seront placés dans ces seaux basé sur le seau id.

N'importe quel nombre d'objets peuvent tomber dans le même compartiment basé sur leur hash code /buckets length valeur. Cela s'appelle une "collision".

Si de nombreux objets de tomber dans le même seau, tandis que la recherche de leur méthode equals() sera appelée pour lever l'ambiguïté.

Le nombre de collisions est indirectement proportionnelle à la segment de longueur.

InformationsquelleAutor Ramesh PVK
2

La réponse ci-dessus est très bonne, mais je tiens à expliquer pourquoi Java peut utiliser indexFor pour créer des index

Exemple, j'ai un HashMap comme ceci (ce test est sur Java7, je vois Java8 changement HashMap beaucoup, mais je pense que cette logique du toujours très bon)
```
//Default length of "budget" (table.length) after create is 16 (HashMap#DEFAULT_INITIAL_CAPACITY)
HashMap<String, Integer> hashMap = new HashMap<>();
hashMap.put("A",1); //hash("A")=69, indexFor(hash,table.length)=69&(16-1) = 5
hashMap.put("B",2); //hash("B")=70, indexFor(hash,table.length)=70&(16-1) = 6
hashMap.put("P",3); //hash("P")=85, indexFor(hash,table.length)=85&(16-1) = 5
hashMap.put("A",4); //hash("A")=69, indexFor(hash,table.length)=69&(16-1) = 5
hashMap.put("r", 4);//hash("r")=117, indexFor(hash,table.length)=117&(16-1) = 5
```
Vous pouvez voir l'index de l'entrée avec la touche "A" et de l'objet avec les principaux "P" et de l'objet avec les principaux "r" ont le même indice (= 5). Et voici le débogage de suite après j'exécute le code ci-dessus

Table dans l'image est ici
```
public class HashMap<K, V> extends AbstractMap<K, V> implements Map<K, V>, Cloneable, Serializable {
    transient HashMap.Entry<K, V>[] table;
    ...
}
```
=> je vois

Si les indices sont différents, une nouvelle entrée sera ajouter à la table

Si l'indice est même et hash est même, la nouvelle valeur sera mise à jour

Si l'indice est même et hash est différents, une nouvelle entrée sera point à l'ancienne entrée (comme un LinkedList). Alors, vous savez pourquoi Map.Entry ont champ next
```
static class Entry<K, V> implements java.util.Map.Entry<K, V> {
        ...
        HashMap.Entry<K, V> next;
}
```
Vous pouvez vérifier à nouveau par lire le code dans HashMap.

Comme maintenant, vous pouvez penser que HashMap sera jamais besoin de changer la taille (16) parce que indexFor() toujours valeur de retour <= 15 mais il pas correcte.

Si vous regardez HashMap code
```
 if (this.size >= this.threshold ...) {
      this.resize(2 * this.table.length);
```
HashMap redimensionner le tableau (le double de la longueur de la table) lorsque size >= threadhold

Qu'est-ce que threadhold? threadhold est calculé ci-dessous
```
static final int DEFAULT_INITIAL_CAPACITY = 16;
static final float DEFAULT_LOAD_FACTOR = 0.75F;
...
this.threshold = (int)Math.min((float)capacity * this.loadFactor, 1.07374182E9F); //if capacity(table.length) = 16 => threadhold = 12
```
Quel est le size? size est calculé ci-dessous.

Bien sûr, size ici n'est pas table.length .

Tout le temps de vous mettre une nouvelle entrée HashMap et HashMap besoin de créer une nouvelle entrée (à noter que HashMap de ne pas créer une nouvelle entrée lorsque la clé est la même, il vient de remplacer la valeur pour existaient entrée) puis size++
```
void createEntry(int hash, K key, V value, int bucketIndex) {
    ...
    ++this.size;
}
```
Espoir aide

InformationsquelleAutor Phan Van Linh
-1

bucket_index = (j'.hashCode() && 0x7FFFFFFFF) % hashmap_size fait le tour

InformationsquelleAutor Ritesh Singh

Vous devez vous connecter pour publier un commentaire.