Utf8_general_ci ou utf8mb4 ou...?
utf16 ou utf32? Je suis en train de stocker le contenu dans beaucoup de langues. Certaines langues utilisent un double-fontes (par exemple, les polices Japonaises sont souvent deux fois plus large que l'anglais polices). Je ne suis pas sûr de la forme de base de données, je devrais être en utilisant. Toutes les informations sur les différences entre ces quatre jeux de caractères...
Vous devez vous connecter pour publier un commentaire.
MySQL
utf32
etutf8mb4
(ainsi que la norme UTF-8) peut directement enregistrer n'importe quel caractère spécifié par Unicode; la première est de taille fixe à 4 octets par caractère alors que la dernière est entre 1 et 4 octets par caractère.utf8mb3
et l'originalutf8
ne peut stocker que de la première de 65 536 codepoints, qui couvrira CJVK (le Chinois, le Japonais, le Vietnam, le coréen), et l'utilisation de 1 à 3 octets par caractère.utf16
utilise 2 octets pour la première de 65 536 codepoints, et 4 octets pour tout le reste.Comme pour les polices, c'est strictement visuelle chose.
"Le Minimum Absolu que Tout Développeur Doit Absolument, Positivement Savoir Sur Unicode et les Jeux de Caractères (Pas d'Excuses!)"
Voir aussi Documentation de MySQL pour le support de l'Unicode.
utf8_general
s'applique à tous les autresutf8_*
classements trop, tout sera à l'aide de MySQLutf8mb3
akautf8
charset.utf8
etutf8mb3
ne couvrent pas tous les caractères CJK, dont certains sont de 4 octets de large.