Comment dois-je stocker GUID dans les tables MySQL?

Dois-je utiliser varchar(36) ou est-il de meilleures façons de le faire?

"thaBadDawg" offre une bonne réponse. Il y a un parallèle fil sur un Débordement de Pile qui traite le sujet. J'ai ajouté quelques commentaires pour que les fils de réponse que les liens vers d'autres ressources avec plus de détails. Voici la question du lien: stackoverflow.com/questions/547118/storing-mysql-guid-uuids - j'espère que ce sujet de plus en plus fréquents quand les gens commencent à réfléchir à AWS et d'Aurora.

InformationsquelleAutor CDR | 2009-01-05

97

Mon DBA m'a demandé quand je les ai interrogés sur la meilleure façon de conserver les Guid pour mes objets pourquoi j'avais besoin de stocker 16 octets quand je pourrais faire la même chose dans les 4 octets avec un Entier. Depuis qu'il a mis ce défi là pour moi, j'ai pensé que le moment était le bon moment de le mentionner. Cela étant dit...

Vous pouvez stocker un guid comme un CHAR(16) binaire si vous voulez faire le plus de l'utilisation optimale de l'espace de stockage.
- Car avec 16 octets, vous pouvez générer les choses de différentes bases de données, sur des machines différentes, à des moments différents, et toujours fusionner ensemble les données de façon transparente 🙂
- besoin de réponse, ce qui est vraiment un char 16 binaire? pas de char? pas binaire? Je ne vois que de taper tout de mysql gui tools, ni aucune documentation dans le site de mysql. @BillyONeal
- Char est le type de données. De BINARY est le spécificateur de type contre le type. Le seul effet est de modifier la façon dont MySQL n'classement. Voir dev.mysql.com/doc/refman/5.0/en/charset-binary-op.html pour plus de détails. Bien sûr, vous pouvez simplement utiliser un type BINAIRE directement si votre base de données, outil d'édition vous permet de le faire. (Les plus anciens outils ne sais pas du type de données binaires, mais ne savez de la colonne binaire drapeau)
- j'ai donc essayé create table p (id char(16)). Donc tous qu'il fait est de créer un char(16) de la colonne avec utf8_bin classement. Je ne sais pas comment insérer un 36 char chaîne hexadécimale (GUID) en elle. Lorsque j'essaie, j'obtiens des caractères illégaux d'erreur.
- en outre do u think char 16 binaire peut surpasser binaire 16 performancewise? J'en doute
- Dans votre application, vous tournez à 36 caractères hexadécimaux chaîne dans le 16 octets en fait, il représente, et de les stocker à la place. (Vous n'avez pas mis le code hexadécimal de la représentation dans la base de données si vous allez le char(16) de l'itinéraire). Aussi loin que char(16) binaire vs binaire(16), je ne vois pas pourquoi il y aurait une différence de performance entre les deux; la seule différence serait le tri et vous ne devriez pas sorte par le GUID pour les perf des zones sensibles de toute façon.
- un CHAR et un champ BINAIRE sont essentiellement les mêmes. Si vous voulez le prendre à la base de niveaux, un CHAR est un champ binaire attend un 0 à 255 valeur avec l'intention de représenter cette valeur avec une valeur de mapped à partir d'une table de recherche (dans la plupart des cas maintenant, UTF8). Un champ BINAIRE prévoit le même type de valeur sans aucune intention de représenter les données d'une table de recherche. J'ai utilisé CHAR(16) de retour dans le 4.x jours car MySQL n'était pas aussi bon qu'il l'est aujourd'hui.
- J'ai essayé avec deux requête: CHAR(16) BINARY et CHAR(16) CHARACTER SET binary. La créer un code que j'ai obtenu après l'exécution de ceux qui étaient, respectivement: CHAR(16) NULL DEFAULT NULL COLLATE 'utf8_bin' et BINARY(16) NULL DEFAULT NULL. En bref, la deuxième requête rien créé, mais un champ binaire. Et c'est seulement dans un tel domaine, je pouvais stocker guid. Pure CHAR(16) utf8_bin champ ne jamais m'a aidé à stocker de guid. Ou peut-être que je ne sais pas comment l'insérer dans un champ de ce type!
- Je ne vois pas en quoi cela fait une différence. Ils sont à la fois d'une largeur fixe de champs de 16 octets, sans aucune restriction sur les données contenues à l'intérieur.
- Il y a plusieurs bonnes raisons pour lesquelles un GUID est beaucoup mieux qu'une auto-incrémentation. Jeff Atwood listes des ces. Pour moi, le meilleur avantage dans l'utilisation d'un GUID est que mon application n'a pas besoin d'une base de données, aller à connaître la clé d'une entité: je pourrais remplir par programme, que je ne pouvais pas faire si j'ai été en utilisant un auto-incrément de champ. Cela m'a sauvé de plusieurs maux de tête: avec GUID je peux gérer l'entité de la même façon, quelle que soit l'entité qui a déjà été persisté ou une nouvelle marque.
InformationsquelleAutor thaBadDawg
41

Je voudrais l'enregistrer comme un char(36).
- Je ne vois pas pourquoi vous devriez stocker -s.
- C'est simple, simple, lisible par l'homme. Il n'est pas nécessaire, bien sûr, mais si le stockage des octets supplémentaires ne fait pas de mal alors que c'est la meilleure solution.
- Stocker les tirets peuvent ne pas être une bonne idée, parce que cela va provoquer plus de surcharge. Si vous voulez le rendre lisible par l'homme, d'en faire la demande en lecture avec les tirets.
- une autre considération est l'analyse de la base de données. La plupart des implémentations d'attendre des tirets dans un guid valide.
InformationsquelleAutor Brian Fisher
31

Ajoutant à la réponse par ThaBadDawg, l'utilisation de ces fonctions pratiques (grâce à une sage collègue de la mine) pour obtenir de 36 longueur de la chaîne à un tableau d'octets de 16.
```
DELIMITER $$
CREATE FUNCTION `GuidToBinary`(
$Data VARCHAR(36)
) RETURNS binary(16)
DETERMINISTIC
NO SQL
BEGIN
DECLARE $Result BINARY(16) DEFAULT NULL;
IF $Data IS NOT NULL THEN
SET $Data = REPLACE($Data,'-','');
SET $Result =
CONCAT( UNHEX(SUBSTRING($Data,7,2)), UNHEX(SUBSTRING($Data,5,2)),
UNHEX(SUBSTRING($Data,3,2)), UNHEX(SUBSTRING($Data,1,2)),
UNHEX(SUBSTRING($Data,11,2)),UNHEX(SUBSTRING($Data,9,2)),
UNHEX(SUBSTRING($Data,15,2)),UNHEX(SUBSTRING($Data,13,2)),
UNHEX(SUBSTRING($Data,17,16)));
END IF;
RETURN $Result;
END
$$
CREATE FUNCTION `ToGuid`(
$Data BINARY(16)
) RETURNS char(36) CHARSET utf8
DETERMINISTIC
NO SQL
BEGIN
DECLARE $Result CHAR(36) DEFAULT NULL;
IF $Data IS NOT NULL THEN
SET $Result =
CONCAT(
HEX(SUBSTRING($Data,4,1)), HEX(SUBSTRING($Data,3,1)),
HEX(SUBSTRING($Data,2,1)), HEX(SUBSTRING($Data,1,1)), '-', 
HEX(SUBSTRING($Data,6,1)), HEX(SUBSTRING($Data,5,1)), '-',
HEX(SUBSTRING($Data,8,1)), HEX(SUBSTRING($Data,7,1)), '-',
HEX(SUBSTRING($Data,9,2)), '-', HEX(SUBSTRING($Data,11,6)));
END IF;
RETURN $Result;
END
$$
```
CHAR(16) est en fait un BINARY(16), choisissez votre saveur préférée

À suivre le code mieux, prendre l'exemple donné les chiffres-commandé GUID ci-dessous. (Caractères illégaux sont utilisés à des fins d'illustration - chaque endroit un caractère unique.) Les fonctions de transformer l'octet de commande pour obtenir un peu d'ordre supérieur de l'indice de clustering. La refonte guid est indiqué ci-dessous l'exemple.
```
12345678-9ABC-DEFG-HIJK-LMNOPQRSTUVW
78563412-BC9A-FGDE-HIJK-LMNOPQRSTUVW
```
Tirets supprimée:
```
123456789ABCDEFGHIJKLMNOPQRSTUVW
78563412BC9AFGDEHIJKLMNOPQRSTUVW
```
- Voici ci-dessus GuidToBinary sans enlever les traits d'union de la chaîne: CRÉER la FONCTION GuidToBinary($guid char(36)) RENVOIE binaire(16) RETURN CONCAT( UNHEX(SUBSTRING($guid, 7, 2)), UNHEX(SUBSTRING($guid, 5, 2)), UNHEX(SUBSTRING($guid, 3, 2)), UNHEX(SUBSTRING($guid, 1, 2)), UNHEX(SUBSTRING($guid, 12, 2)), UNHEX(SUBSTRING($guid, 10, 2)), UNHEX(SUBSTRING($guid, 17, 2)), UNHEX(SUBSTRING($guid, 15, 2)), UNHEX(SUBSTRING($guid, 20, 4)), UNHEX(SUBSTRING($guid, 25, 12)));
- Pour les curieux, ces fonctions sont supérieures à la juste UNHEX(REMPLACER(UUID(),'-',")) parce qu'il arrange les bits dans un ordre qui permettra de mieux performer dans un index cluster.
- C'est très utile, mais je pense qu'il pourrait être amélioré avec une source pour CHAR et BINARY équivalence (la doc semblent impliquer qu'il existe des différences importantes et une explication de l'index cluster, meilleure est la performance réorganisées octets.
- Lorsque j'utilise mon guid est changé. J'ai essayé de l'insérer à l'aide de deux unhex(replace(chaîne, '-', ")) et la fonction ci-dessus et lorsque je les convertir en arrière en utilisant les mêmes méthodes que le guid est sélectionné n'est pas celui qui a été inséré. Ce qui est en train de transformer le guid? Tout ce que j'ai fait copié le code ci-dessus.
- Pourriez-vous s'il vous plaît partager le code pour BinaryToGuid() la fonction?
InformationsquelleAutor KCD
24

char(36) serait un bon choix. Aussi MySQL UUID() fonction qui retourne un 36 caractères de texte (format hex avec des traits d'union) qui peuvent être utilisés pour les extractions de ces Identifiants de la db.

InformationsquelleAutor Learning
17

"Mieux" dépend de ce que vous êtes à l'optimisation pour les.

Combien vous vous souciez de la taille de stockage/performance contre, la facilité de développement? Plus important encore, êtes - vous générer suffisamment de Guid, ou de les chercher assez fréquemment, que c'est important?

Si la réponse est "non", char(36) est plus assez bon, et il fait de stockage/récupération de Guid morts-simple. Sinon, binary(16) est raisonnable, mais vous aurez à appuyer sur MySQL et/ou de votre langage de programmation de choix pour convertir en arrière à partir de l'habituelle représentation sous forme de chaîne.
- Si vous hébergez le logiciel (c'est à dire une page web par exemple) et de ne pas la vendre ou de l'installer dans le client, vous pouvez toujours commencer avec char(36) pour faciliter le développement dans le stade précoce de le logiciel, et muter à un format plus compact que le système se développe dans l'utilisation et commence à avoir besoin d'optimisation.
- Le plus grand inconvénient de beaucoup plus de char(36) est l'espace de l'index prendra. Si vous avez un grand nombre d'enregistrements dans la base de données, vous êtes doublement de la taille de l'index.
InformationsquelleAutor candu
8

Binaire(16) serait très bien, mieux que d'utiliser des varchar(32).

InformationsquelleAutor Onkar Janwa
7

La GuidToBinary routine posté par KCD devrait être modifié pour tenir compte de la structure de bits de l'horodatage dans la chaîne GUID. Si la chaîne de caractères représente une version 1 UUID, comme ceux retournés par l'uuid() de mysql routine, le temps que les composants sont intégrés dans les lettres 1-G, à l'exclusion de la D.
```
12345678-9ABC-DEFG-HIJK-LMNOPQRSTUVW
12345678 = least significant 4 bytes of the timestamp in big endian order
9ABC     = middle 2 timestamp bytes in big endian
D        = 1 to signify a version 1 UUID
EFG      = most significant 12 bits of the timestamp in big endian
```
Lors de la conversion en binaire, le meilleur ordre pour l'indexation serait: EFG9ABC12345678D + le reste.

Vous ne voulez pas de swap 12345678 à 78563412 parce que big endian déjà produit les meilleurs index binaire d'ordre des octets. Cependant, vous voulez le plus important octets déplacé en face de la basse-octets. Par conséquent, EFG y aller en premier, suivie par le moyen de bits et bits de poids faible. Générer une douzaine Uuid avec l'uuid() au cours d'une minute et vous devriez voir comment cet ordre donne le rang correct.
```
select uuid(), 0
union 
select uuid(), sleep(.001)
union 
select uuid(), sleep(.010)
union 
select uuid(), sleep(.100)
union 
select uuid(), sleep(1)
union 
select uuid(), sleep(10)
union
select uuid(), 0;
/* output */
6eec5eb6-9755-11e4-b981-feb7b39d48d6
6eec5f10-9755-11e4-b981-feb7b39d48d6
6eec8ddc-9755-11e4-b981-feb7b39d48d6
6eee30d0-9755-11e4-b981-feb7b39d48d6
6efda038-9755-11e4-b981-feb7b39d48d6
6f9641bf-9755-11e4-b981-feb7b39d48d6
758c3e3e-9755-11e4-b981-feb7b39d48d6 
```
Les deux premiers Uuid ont généré le plus proche dans le temps. Ils ne varient dans le dernier 3 unités du premier bloc. Ce sont les bits de poids faible de l'horodatage, ce qui signifie que nous voulons pour les pousser vers la droite lorsque nous convertir à un indexables tableau d'octets. Comme un contre-exemple, le dernier ID est le plus courant, mais le KCD de l'algorithme de permutation serait de le placer avant le 3ème ID (3e avant dc, derniers octets à partir du premier bloc).

L'ordre correct pour l'indexation serait:
```
1e497556eec5eb6... 
1e497556eec5f10... 
1e497556eec8ddc... 
1e497556eee30d0... 
1e497556efda038... 
1e497556f9641bf... 
1e49755758c3e3e... 
```
Voir cet article pour plus de renseignements à l'appui: http://mysql.rjweb.org/doc.php/uuid

*** notez que je n'ai pas diviser la version grignoter de la haute 12 bits de l'horodatage. C'est le D grignoter à partir de votre exemple. Je viens de jeter en avant. Donc, mon séquence binaire finit par être DEFG9ABC et ainsi de suite. Cela implique que tous mes indexé Uuid de démarrer avec le même grignoter. L'article fait la même chose.
- est le but de ce pour économiser l'espace de stockage? ou de faire le tri utiles?
- Il crée un meilleur tri des index. L'espace reste le même.
InformationsquelleAutor bigh_29
5

Pour ceux qui viennent tout juste de tomber sur ce sujet, il existe maintenant une bien meilleure alternative que par la recherche par Percona.

Il se compose d'une réorganisation de la UUID morceaux pour optimiser l'indexation, puis de les convertir en binaire pour le stockage réduite.

Lire l'article complet ici
- J'ai lu cet article avant. Je trouve cela très intéressant mais alors, comment devrions-nous effectuer une requête si nous voulons filtre par un ID qui est binaire? Je suppose que nous avons besoin d'hex de nouveau et ensuite appliquer les critères. Est-il si exigeant? Pourquoi stocker binaire(16) (assurez-vous qu'il est mieux que varchar(36)) au lieu de bigint de 8 octets?
- Il y a une mise à jour de l'article à partir de MariaDB qui devrait répondre à votre question mariadb.com/kb/en/mariadb/guiduuid-performance
- fwiw, UUIDv4 est complètement aléatoire, et ne nécessite pas de segmentation.
InformationsquelleAutor sleepycal

Je vous suggérons d'utiliser les fonctions ci-dessous depuis que celles mentionnées par @bigh_29 transforme mon guid dans les nouveaux (pour des raisons que je ne comprends pas). Aussi, ce sont un peu plus vite dans les tests que j'ai fait sur mes tables. https://gist.github.com/damienb/159151

DELIMITER |
CREATE FUNCTION uuid_from_bin(b BINARY(16))
RETURNS CHAR(36) DETERMINISTIC
BEGIN
DECLARE hex CHAR(32);
SET hex = HEX(b);
RETURN LOWER(CONCAT(LEFT(hex, 8), '-', MID(hex, 9,4), '-', MID(hex, 13,4), '-', MID(hex, 17,4), '-', RIGHT(hex, 12)));
END
|
CREATE FUNCTION uuid_to_bin(s CHAR(36))
RETURNS BINARY(16) DETERMINISTIC
RETURN UNHEX(CONCAT(LEFT(s, 8), MID(s, 10, 4), MID(s, 15, 4), MID(s, 20, 4), RIGHT(s, 12)))
|
DELIMITER ;

InformationsquelleAutor vsdev

-4

si vous avez un char/varchar valeur mise en forme comme le standard GUID, vous pouvez tout simplement les stocker en tant que fichier BINAIRE(16) à l'aide de la distribution simple(MyString COMME BINARY16), sans toutes ces ahurissant séquences de CONCAT + SUBSTR.

BINAIRE(16) les champs sont comparées/trier/indexés beaucoup plus rapide que les chaînes, et aussi prendre deux fois moins d'espace dans la base de données
- L'exécution de cette requête montre que la FONTE convertit l'uuid de la chaîne d'octets ASCII: set @a = uuid(); select @une, hex( cast(@un BINAIRE(16))); - je obtenir 16f20d98-9760-11e4-b981-feb7b39d48d6 : 3136663230643938 2D 39373630 2D 3131 (espaces ajoutés pour la mise en forme). 0x31=ascii 1, 0x36=ascii 6. Nous avons même 0x2D, qui est le trait d'union. Ce n'est pas tellement différent que de simplement stocker le guid comme une chaîne de caractères, à l'exception que vous tronquez la chaîne lors de la 16e caractère, qui clive la partie de l'ID qui est spécifique à l'appareil.
- Oui, c'est tout simplement de la troncature. select CAST("hello world, this is as long as uiid" AS BINARY(16)); produit hello world, thi
InformationsquelleAutor George Hazan

Vous devez vous connecter pour publier un commentaire.