Quelles sont les principales différences de performances entre varchar et nvarchar types de données SQL Server?

Je suis en train de travailler sur une base de données pour une petite application web à mon école, à l'aide de SQL Server 2005.

Je vois un couple d'écoles de pensée sur la question de la varchar vs nvarchar:

Utilisation varchar, sauf si vous avez affaire à un beaucoup de l'internationalisation de données, puis utiliser nvarchar.
Suffit d'utiliser nvarchar pour tout.

Je commence à en voir le fond de la vue 2. Je sais que nvarchar prend deux fois plus d'espace, mais qui n'est pas nécessairement une affaire énorme puisque c'est seulement pour stocker des données pour quelques centaines d'étudiants. Pour moi, il me semble qu'il serait plus facile de ne pas s'en soucier et juste permettre à tout pour utiliser le type de données nvarchar. Ou est-il quelque chose que je suis absent?

question similaire ici: stackoverflow.com/questions/312170/... EDIT par le dorfier: ce qui est intéressant est venu à la conclusion opposée.
référence beaucoup plus vaste thread qui est venu à la conclusion opposée. stackoverflow.com/questions/312170/...
Jason: j'espère que ce n'est pas inadapté à la demande, mais pouvez-vous s'il vous plaît envisager de changer la accepté de répondre à gbn de l'. JoeBarone la réponse est horriblement mal pour de nombreuses raisons. Avoir "accepté" induit en erreur les novices en faisant de mauvais choix. Il est inutile et un gaspillage à "toujours utiliser NVARCHAR", et cela peut avoir des impacts très négatifs sur les performances et les coûts de matériel / les budgets. Quelques lignes, voire quelques milliers, n'a pas d'importance. Mais les systèmes de croître plus rapidement que les gens attendent, de sorte que le courant a accepté de répondre est un mauvais service à la communauté. Je vous remercie.

InformationsquelleAutor Jason Baker | 2008-08-29

142

Toujours utiliser le type de données nvarchar.

Vous pouvez ne jamais avoir besoin les caractères à double octet pour la plupart des applications. Toutefois, si vous avez besoin de soutien à double octet langues et vous n'avez qu'un seul octet de soutien dans votre schéma de base de données, il est vraiment cher pour revenir en arrière et modifier tout au long de votre application.

Le coût de la migration d'une application de type varchar nvarchar sera beaucoup plus que le peu d'espace disque supplémentaire que vous allez utiliser dans la plupart des applications.
- il est beaucoup plus difficile de revenir en arrière et ajouter le support pour le texte/les messages, les fuseaux horaires, les unités de mesure et de la monnaie, de sorte que chacun DOIT toujours ces codes dans leur application dès le premier jour, TOUJOURS (même si c'est seulement sur votre page d'accueil web app)!
- Ce sujet de la taille de l'index, l'utilisation de la mémoire, etc? Je suppose que vous utilisez toujours int lorsque vous pouvez utiliser tinyint trop "juste au cas où"?
- le point de vôtre n'est pas le sens de la question et la réponse, mais encore quelque chose de très important à prendre en compte.
- L'ajout du support de l'Unicode n'est pas si difficile si .NET est en cours d'utilisation. Il pourrait être aussi simple que de changer les colonnes varchar nvarchar, puisque vous ne perdrez pas les données de la conversion d'une page de code Unicode. Le code d'application existant peut impliquer caractère contraintes que vous souhaitez simplement avoir à vous détendre ou à supprimer. .NET les données de caractères au format Unicode, et SQL types de paramètres sont souvent déterminés automatiquement ou est converti implicitement par la base de données de la colonne type. Chaîne de requête SQL constantes peuvent avoir besoin d'être précédées d'un 'N', et certains de codage de la chaîne d'appels peuvent avoir besoin d'utiliser de l'utf-8 ou Unicode.
- Toujours de codage/de planification pour un site multilingue (lorsque vous n'avez aucune idée de ce que vous aurez jamais besoin d'elle), c'est comme dire à tous les jeunes adultes, ils devraient s'acheter un big 8 places, énergivores VUS pour leur première voiture...après tout, ils pourraient se marier un jour, et peut avoir 6 enfants, . Je préfère profiter de la performance et de l'efficacité alors que je peux et de payer le prix de la mise à niveau lorsque/si j'en ai besoin.
- votre point de vue sur toujours à l'aide de int à la place de tinyint n'est pas la même comparaison à l'aide de nvarchar vs varchar. Si vous avez un champ pour, disons, les registres de l'état (1=actif, 0=supprimé, etc) et vous SAVEZ que vous n'auriez jamais plus de 256 valeurs, puis tinyint ce serait bien. Mais avez-vous jamais SAVEZ que votre application ne pas utiliser les caractères arabes? Peut-être, peut-être pas. Mais j'assume pas et utilisez le type de données nvarchar.
- J' ne pas code pour ce que j'ai ne pas en savoir. Mais si vous pouvez l'utiliser avec n'notable de performances, alors vos bases de données ne sont pas assez grands pour elle à la matière...
- Généralement, quand les gens commencent leur répondre avec le mot "Toujours", alors vous devez ignorer tout ce qui vient après. (Notez que j'ai commencé cette déclaration avec le mot "habituellement" 🙂
- NVARCHAR est Unicode stockées en tant que UCS2, qui utilise SQL Server 2x de l'espace de stockage par rapport à tout simplement VARCHAR. Cela signifie que vous pouvez mettre en cache la moitié du nombre de lignes dans la mémoire, et votre espace de stockage IO prend deux fois plus longtemps.
- C'est affreusement horrible conseils. Toujours utiliser NVARCHAR? Vous n'avez pas de travail pour EMC, Oracle, pensez-vous? 😉
- Terrible des conseils. Si vous ne pensez pas avoir besoin de double octets pourquoi chercher le stockage et le traitement des frais généraux.
- Je sais que c'est vieux, mais c'est de mauvais conseils, et devrait PAS être accepté de répondre.
- Clairement, Microsoft a foiré en nous permettant de toujours utiliser varchar chaque fois que nous aimons. Que pensent-ils?!....
InformationsquelleAutor Joe Barone
225

De l'espace disque n'est pas la question... mais la mémoire et les performances.
Le Double de la page lit, double la taille de l'index, étrange COMME et = constante de comportement etc

Avez-vous besoin pour stocker les Chinois etc script? Oui ou non...

Et à partir de MS BOL "De stockage et les Effets sur les Performances de l'Unicode"

Modifier:

Récente DONC, la question en soulignant comment le mauvais type nvarchar la performance peut être...

SQL Server utilise élevé CPU lors de la recherche à l'intérieur de chaînes de type nvarchar
- +1, si votre application s'ouvre à l'international, vous aurez de nombreuses autres questions à se soucier que d'une recherche/remplacement type de données nvarchar: texte multilingue/messages, les fuseaux horaires, les unités de mesure et monnaie
- Mais que faire si vous avez besoin de stocker un nom étranger, parfois, à l'instar de José ou Bjørn?
- ensuite, vous utilisez le type de données nvarchar. Ce que vous ne le faites pas utiliser inutilement. Ces 2 noms ajustement en varchar de toute façon IIRC
- gbn - Corriger celles-ci sont couvertes par le dictionnaire de Latin, ils travaillent pour des langues à travers l'amende en Europe, ses autres langues telles que l'arabe, le mandarin qui ont besoin d'utiliser l'unicode
- Je ne comprends pas cette strange LIKE and = constant behaviour partie. Pourriez-vous ajouter quelques détails de ce que vous entendez par là?
- Dire l'espace disque n'est pas un problème n'est pas vrai pour tout le monde. Nous avons naïvement utilisé nvarchar inutilement dans une grande banque d'application avec des milliards d'enregistrements stockés pendant de nombreuses années. Avec cher SAN de stockage en fonction de la réplication, la sauvegarde et la reprise après sinistre, cela peut traduire des millions de dollars de coûts pour nvarchar vs varchar. Pour ne pas mentionner il ya une grande (100%) impact sur la performance du lire deux fois le nombre d'octets du disque pour tous les lire.
- et al: j'ai fait ce que j'ai pu aborder la question de l'espace perdu, de manière globale dans l'article suivant: Disque n'Est pas Cher! ORLY? (inscription gratuite est requise, tout de même). L'article est destiné à aider à prévenir la situation que codemonkey couru à ce sujet cher, au niveau de l'entreprise de stockage.
InformationsquelleAutor gbn
60

Être cohérent! REJOIGNEZ-ing un VARCHAR de type NVARCHAR a un gros gain de performance.
- Si vous êtes en train de faire des jointures sur des champs de caractère alors votre base de données a probablement pire que de savoir si l'utilisation de type nvarchar ou varchar, d'une manière générale.
- Harlan Un simple test montre pour moi qu'il n'y a pas de différence tangible entre les rejoindre nvarchar à varchar vs conversion nvarchar à varchar et de se joindre à varchar. À moins bien sûr que vous voulait être cohérent dans la colonne type de données, pas l'adhésion.
- et Thomas: 1) "simple" des tests sont souvent trompeuses car elles ne couvrent pas les variations qui provoquent des différences de comportement. 2) Si on voit une chute drastique des performances lors du mélange de VARCHAR et NVARCHAR, qui doit être dû à l'indexation de la VARCHAR colonne avec le type de Classement utilisé pour la colonne (et donc de l'indice). Je couvre ce sujet en détail dans le blog suivant: Impact sur des Indices Lors du Mixage de type VARCHAR et NVARCHAR Types.
InformationsquelleAutor Thomas Harlan
42

nvarchar va avoir une surcharge importante de mémoire, de stockage et d'indexation, de sorte que si les spécifications dicter qu'il aura vraiment jamais être nécessaire, n'est pas la peine.

Je n'aurais pas un dur et rapide "toujours nvarchar" règle car il peut être un gaspillage dans de nombreuses situations - notamment ETL de ASCII/EBCDIC ou les identifiants et code colonnes qui sont souvent les clés et les clés étrangères.

D'autre part, il y a beaucoup de cas de colonnes, où je voudrais être sûr de poser cette question au début et si je n'ai pas de réponse absolue immédiatement, je ferais la colonne de type nvarchar.

InformationsquelleAutor Cade Roux
24

Je hésitez pas à en ajouter encore une autre réponse ici comme il y a déjà quelques, mais quelques points doivent être faites, qui n'ont pas été fait ou pas fait clairement.

Première: Ne pas toujours utiliser NVARCHAR. C'est très dangereux, et souvent coûteuses, de l'attitude ou de l'approche. Et c'est pas mieux de dire "Jamais utilisez les curseurs", car ils sont parfois le moyen le plus efficace de résoudre un problème particulier, et le travail commun autour de faire un WHILE boucle sera presque toujours plus lent qu'un correctement fait du Curseur.

Le seul moment où vous devez utiliser le terme "toujours", c'est quand vous conseillant de "faire toujours ce qui est mieux pour la situation". Accordé qui est souvent difficile à déterminer, surtout lorsqu'on tente d'équilibrer les gains à court terme en temps de développement (manager: "nous avons besoin de cette fonctionnalité, que vous ne connaissiez pas jusqu'à maintenant -- il y a une semaine!") avec à long terme des coûts de maintenance (gestionnaire qui, au départ, des pressions équipe de 3 mois dans 3 semaines sprint: "pourquoi sommes-nous à avoir ces problèmes de performances? Comment pourrions-nous l'avez peut-être fait X qui n'a pas de flexibilité? Nous ne pouvons nous permettre un sprint ou deux pour résoudre ce problème. Que pouvons-nous faire dans une semaine si nous pouvons revenir à nos articles de priorité? Et nous avons certainement besoin de passer plus de temps dans la conception si cela ne veut pas continuer comme ça!").

Deuxième: @gbn la réponse de touche sur certains points très importants à considérer lors de la prise de certaines données de la modélisation des décisions lorsque le chemin n'est pas 100% clair. Mais il n'y a même plus à prendre en compte:
- la taille des fichiers journaux de transactions
- temps qu'il faut pour reproduire (si vous utilisez la réplication)
- temps qu'il faut pour ETL (si ETLing)
- temps qu'il faut pour expédier les journaux à un système distant et de restauration (si vous utilisez l'envoi de Journaux)
- la taille des sauvegardes
- longueur de temps qu'il faut pour effectuer la sauvegarde
- longueur de temps qu'il faut pour faire une restauration (ce qui pourrait être important quelques jours 😉
- de la taille nécessaire pour la base de données tempdb
- performance de déclencheurs (pour les tables inserted et deleted qui sont stockées dans la base de données tempdb)
- de la performance de la ligne de contrôle de version (si l'utilisation de l'ISOLEMENT d'INSTANTANÉ, depuis la version magasin est dans la base de données tempdb)
- de la capacité à obtenir de l'espace disque supplémentaire lors de la CAF dit qu'ils ont juste dépensé 1 million de dollars sur un SAN dernière année, et ils ne seront pas autoriser une autre 250k $pour le stockage supplémentaire
- longueur de temps qu'il faut pour faire INSÉRER et mettre à JOUR les opérations
- longueur de temps qu'il faut pour faire la maintenance des index
- etc, etc, etc.
Perdre de l'espace a un énorme des conséquences en cascade sur l'ensemble du système. J'ai écrit un article qui va en explicite en détail sur ce sujet: Le Disque N'Est Pas Cher! ORLY? (inscription gratuite obligatoire; désolé je n'ai pas de contrôle que de la politique).

Troisième: Alors que certaines réponses sont mal en se concentrant sur le "c'est une petite application" aspect, et certains sont correctement ce qui suggère "l'utilisation de ce qui est approprié", aucune des réponses ont fourni un véritable orientation de l'O. P. Un détail important mentionné dans la Question, c'est que c'est une page web de leur école. Super! Nous pouvons donc suggérer que:
- Champs pour les Étudiants et/ou de la Faculté des noms probablement être NVARCHAR depuis, au fil du temps, il est seulement plus susceptibles que les noms d'autres cultures, seront à l'affiche jusqu'en ces lieux.
- Mais pour la rue, de l'adresse et les noms de ville? Le but de l'application n'a pas été précisé (il aurait été utile), mais en supposant que l'adresse de dossier, le cas échéant, se rapportent seulement à une région géographique particulière (c'est à dire une seule langue /culture), puis utilisez VARCHAR avec le Code approprié de la Page (qui est déterminé par le Classement du domaine).
- Si le stockage d'Etat et/ou les codes ISO (pas besoin de stocker INT /TINYINT depuis des codes ISO sont de longueur fixe, lisible par l'homme, et bien, norme 🙂 utilisez CHAR(2) pour les deux codes de lettres et CHAR(3) si à l'aide de code à 3 lettres. Et pensez à utiliser un Classement binaire comme Latin1_General_100_BIN2.
- Si le stockage des codes postaux (c'est à dire les codes postaux), l'utilisation VARCHAR car c'est une norme internationale à ne jamais utiliser la lettre en dehors de A-Z. Et oui, toujours utiliser VARCHAR même si le stockage de NOUS codes postaux et pas INT depuis les codes postaux ne sont pas des numéros, ils sont des chaînes de caractères, et certains d'entre eux ont un "0". Et pensez à utiliser un Classement binaire comme Latin1_General_100_BIN2.
- Si le stockage d'adresses e-mail et/ou Url, utilisez NVARCHAR depuis ces deux peut maintenant contenir des caractères Unicode.
- et ainsi de suite....
Quatrième: Maintenant que vous avez NVARCHAR prise de données jusqu'à deux fois plus d'espace que nécessaire pour les données qui s'intègre parfaitement dans VARCHAR ("va très bien" = ne pas se transformer en "?") et en quelque sorte, comme si par magie, l'application n'a grandir et maintenant il y a des millions d'enregistrements dans au moins un de ces domaines où plus lignes sont ASCII standard, mais certains contiennent des caractères Unicode sorte que vous devez garder NVARCHAR, considérez les points suivants:
1. Si vous utilisez SQL Server 2008 - 2016 RTM et sont sur Enterprise Edition, OU si vous utilisez SQL Server 2016 SP1 (qui fait de la Compression des Données disponibles dans toutes les éditions) ou une version plus récente, vous pouvez activer La Compression De Données. La Compression de données peut (mais ne pas "toujours") compresser les données Unicode dans NCHAR et NVARCHAR champs. Les facteurs déterminants sont:
  1. NCHAR(1 - 4000) et NVARCHAR(1 - 4000) utiliser le Schéma de Compression Standard Unicode, mais seulement à partir de SQL Server 2008 R2, ET seulement DANS la LIGNE de données, pas de DÉBORDEMENT! Cela semble être mieux que l'ordinaire de lignes /PAGE algorithme de compression.
  2. NVARCHAR(MAX) et XML (et je suppose aussi VARBINARY(MAX), TEXT, et NTEXT) à des données EN LIGNE (pas de ligne de MÉTIER ou de DÉBORDEMENT de pages) peuvent au moins être compressé, mais pas LIGNE comprimé. Bien sûr, la PAGE de compression dépend de la taille de l'en-ligne valeur: j'ai testé avec VARCHAR(MAX) et vu que 6000 caractères/octet lignes ne serait pas compresser, mais 4000 caractères/octet lignes n'.
  3. HORS LIGNE des données, LOB ou OVERLOW = Pas de Compression Pour Vous!
2. Si vous utilisez SQL Server 2005 ou 2008 - 2016 RTM et pas sur Enterprise Edition, vous pouvez avoir deux champs: l'un VARCHAR et un NVARCHAR. Par exemple, disons que vous êtes stocker les Url qui sont pour la plupart de la base de caractères ASCII (valeurs de 0 - 127) et donc de s'insérer dans VARCHAR, mais ont parfois des caractères Unicode. Votre schéma peut inclure les éléments suivants 3 champs:
```
  ...
  URLa VARCHAR(2048) NULL,
  URLu NVARCHAR(2048) NULL,
  URL AS (ISNULL(CONVERT(NVARCHAR([URLa])), [URLu])),
  CONSTRAINT [CK_TableName_OneUrlMax] CHECK (
                    ([URLa] IS NOT NULL OR [URLu] IS NOT NULL)
                AND ([URLa] IS NULL OR [URLu] IS NULL))
);
```
  Dans ce modèle vous seulement SÉLECTIONNER à partir de la [URL] colonne calculée. Pour l'insertion et la mise à jour, vous de déterminer qui est le champ par voir si la conversion en modifie la valeur entrante, qui doit être de NVARCHAR type:
```
INSERT INTO TableName (..., URLa, URLu)
VALUES (...,
        IIF (CONVERT(VARCHAR(2048), @URL) = @URL, @URL, NULL),
        IIF (CONVERT(VARCHAR(2048), @URL) <> @URL, NULL, @URL)
       );
```
3. Vous pouvez GZIP entrant des valeurs dans VARBINARY(MAX) et de les décompresser sur le moyen de sortir:
  - Pour SQL Server 2005 - 2014: vous pouvez utiliser SQLCLR. SQL# (un SQLCLR bibliothèque que j'ai écrit) est livré avec Util_GZip et Util_GUnzip dans la version Gratuite
  - Pour SQL Server 2016 et plus récent: vous pouvez utiliser le haut- COMPRESS et DECOMPRESS fonctions, qui sont également GZip.
4. Si vous utilisez SQL Server 2017 ou plus récent, vous pouvez regarder dans la table, un Index Columnstore Cluster.
5. Alors que ce n'est pas une option viable encore, SQL Server 2019 introduit la prise en charge native pour l'UTF-8 dans VARCHAR /CHAR les types de données. Il y a actuellement trop de bugs avec elle pour lui pour être utilisés, mais s'ils sont fixes, alors c'est une option pour certains scénarios. Veuillez voir mon post, "Natif de l'UTF-8 est pris en charge dans SQL Server 2019: Sauveur ou Faux Prophète?", pour une analyse détaillée de cette nouvelle fonctionnalité.
- Slow Clap. tout Simplement étonné que "toujours utiliser le type de données nvarchar" a obtenu 140 voix et cela n'a pas. Excellent travail sur ce post.
- Merci. Pour être juste, l'on a accepté la réponse a été posté 7 années avant le mien, donc il y a beaucoup de circulation qui ont voté sur elle (et/ou de diverses autres) qui ne revint jamais à réévaluer. Encore, il offre un très bon contrepoint à la "sagesse de la foule" théorie que les lecteurs de voter des forums. Il y a aussi beaucoup de désinformation là-bas. Par exemple, ceci sur DBA.SE. L'autre réponse, a accepté avant que j'ai posté le mien, est "correct" par la plus petite des définitions, trompeur, et contient des infos qui me réfuter, dans la mienne, mais encore, il dépasse la mienne.
InformationsquelleAutor Solomon Rutzky
21

Pour votre application, nvarchar est bien parce que la taille de base de données est petit. En disant "toujours utiliser le type de données nvarchar" est une grande simplification. Si vous n'êtes pas obligé de stocker des choses comme des Kanji ou d'autres personnages loufoques, l'utilisation de type VARCHAR, il va utiliser beaucoup moins d'espace. Mon prédécesseur à mon emploi actuel conçu quelque chose à l'aide de type NVARCHAR quand il n'était pas nécessaire. Nous avons récemment mis en VARCHAR et enregistré 15 GO sur la table (il était très écrites). En outre, si vous avez alors un index sur la table et vous souhaitez inclure cette colonne ou d'en faire un indice composite, vous avez tout à fait votre indice de taille de fichier plus importante.

Juste être sérieux dans votre décision; dans SQL de développement et de définitions de données, il semble rarement être un "défaut de réponse" (autre que d'éviter les curseurs à tous les frais, bien sûr).

InformationsquelleAutor WebMasterP
10

Depuis votre application est petite, il n'y a pratiquement pas sensible augmentation des coûts à l'aide de nvarchar plus de varchar, et que vous enregistrez vous-même le potentiel de maux de tête en bas de la route si vous avez besoin de stocker des données unicode.

InformationsquelleAutor tbreffni
8

En général; Commencer avec le plus cher de type de données qui a le moins de contraintes. La mise en production d'. Si la performance commence à être un problème, ce qui est réellement stocké dans ces nvarchar colonnes. Est-il des personnages qui ne rentre pas dans varchar? Si non, passez en varchar. N'essayez pas de pré-optimiser avant que vous savez où la douleur est. Ma conjecture est que le choix entre nvarchar/varchar n'est pas ce qui va ralentir votre application dans le foreseable avenir. Il y aura d'autres parties de l'application où l'optimisation des performances vous donnera beaucoup plus de bang for the bucks.

InformationsquelleAutor Kjetil Klaussen
7

Pour que les quelques dernières années, tous nos projets ont utilisé NVARCHAR pour tout, depuis tous ces projets sont multilingues. L'import de données à partir de sources externes (par exemple, un fichier ASCII, etc.) est-converti en Unicode avant d'être inséré dans la base de données.

Je n'ai pas encore rencontrer des problèmes liés aux performances de la plus grande indices, etc. Les indices ne utiliser plus de mémoire, mais la mémoire n'est pas cher.

Si vous utilisez des procédures stockées ou construire SQL à la volée s'assurer que toutes les constantes de chaîne avec le préfixe N (par exemple SET @foo = N'Hello monde".;) si la constante est également Unicode. Ceci permet d'éviter tout type de chaîne de conversion au moment de l'exécution.

YMMV.
- Vous n'avez probablement pas plusieurs centaines de millions d'enregistrements dans les tables que vous travaillez avec. Je suis d'accord que pour la plupart des applications par défaut de type nvarchar est bien, mais pas tous.
InformationsquelleAutor devstuff
7

Je peux parler d'expérience sur ce, méfiez-vous des nvarchar. Sauf si vous avez absolument besoin de ces données type de champ détruit la performance sur la base de données plus importante. J'ai hérité d'une base de données qui était mal en termes de performances et de l'espace. Nous avons été en mesure de réduire de 30 go de données dans la taille de 70%! Il y avait quelques autres modifications apportées à l'aide de la performance, mais je suis sûr que le varchars'ont aidé de façon significative avec que ainsi. Si votre base de données a le potentiel pour la croissance des tables de un million de + enregistrements rester à l'écart de nvarchar à tout prix.

InformationsquelleAutor J.A
4

Je m'occupe de cette question au travail souvent:
- FTP flux de stocks et les prix - les descriptions de poste et d'autres textes ont été dans nvarchar quand varchar a bien fonctionné. La conversion de ces varchar réduire la taille du fichier de presque de moitié et a vraiment aidé avec le téléchargement.
- Le scénario ci-dessus a bien fonctionné jusqu'à ce que quelqu'un a mis un caractère spécial dans la description de l'objet (peut-être de la marque, ne peut pas se souvenir)
Je n'ai pas encore utiliser nvarchar chaque fois plus de type varchar. Si il y a un doute ou un potentiel de caractères spéciaux, j'utilise de type nvarchar. Je trouve que j'utilise varchar plupart du temps quand je suis dans le contrôle à 100% de ce qui est de peupler le champ.

InformationsquelleAutor K Richard
3

Pourquoi, dans toute cette discussion, il n'y a aucune mention de l'UTF-8? Être capable de stocker de l'unicode complète durée de caractères ne pas dire qu'on doit toujours attribuer deux octets par caractère (ou "code" point d'utilisation de l'UNICODE terme). L'ensemble de l'ASCII est UTF-8. SQL Server vérifie VARCHAR() de champs que le texte est stricte ASCII (c'est à dire en haut de l'octet bit zéro)? J'espère que non.

Si vous souhaitez stocker unicode et veulent la compatibilité avec les anciens ASCII-seules les demandes, je pense que l'utilisation d'VARCHAR() et UTF-8 serait la solution miracle: Il n'utilise plus d'espace quand il en a besoin.

Pour ceux peu familiers avec l'encodage UTF-8, je pourrais recommander une couche d'apprêt.
- Ce que vous suggérez pourrait fonctionner pour certaines applications, mais il faut aussi tenir compte de l'incidence d'un supplément de codage de la couche sur la façon de texte SQL est traitée. En particulier, les classements, la recherche, et le filtrage sera effectué. Et si les rapports sont exécutés sur la base de données, d'outils de reporting standards ne seront pas interperate les caractères multi-octets correctement. Et en vrac, les importations et les exportations peuvent être effectuées. Je pense que sur le long terme, ce régime peut être plus d'ennuis que cela vaut la peine.
- Il n'est pas possible de stocker de l'UTF-8 dans les colonnes VARCHAR. MSSQL sera toujours convertir vos données UTF-8 pour le classement de la colonne. Si vous gâcher le classement (comme essayer de stocker CP1252 dans Latin_1) la conversion ne fonctionnera pas et vous vous retrouverez avec des octets supplémentaires dans vos données. Il peut semble pour fonctionner correctement lorsque vous convertissez latin_1 de l'UTF-8 (sur le côté app) et de nouveau à latin_1 (db côté) mais c'est juste une illusion. Vous pouvez vous faufiler par la DB automatique de la conversion de votre classement de la colonne en utilisant freetds et la spécification du protocole à quelque chose de moins que 7, mais vous perdre la capacité de requête de type nvarchar.
- et Tevya: cette réponse est un peu non dénués de sens. SQL Server utilise uniquement des UCS-2 ET UTF-16 pour stocker des données Unicode (c'est à dire XML et Npréfixé types). Vous n'obtenez pas un choix de l'utilisation de l'UTF-8. Aussi, les codages Unicode (UTF-8, UCS-2 ET UTF-16 et UTF-32) ne peut pas être appliquée à des champs VARCHAR.
InformationsquelleAutor Tevya
2

Il va y avoir des circonstances exceptionnelles, quand vous voulez délibérément de restreindre le type de données pour s'assurer qu'il n'est pas contenir des caractères à partir d'un certain ensemble. Par exemple, j'avais un scénario où je devais stocker le nom de domaine dans une base de données. L'Internationalisation des noms de domaine n'était pas fiable, à l'époque, il était donc préférable de limiter l'entrée au niveau de la base, et d'aider à éviter les problèmes potentiels.

InformationsquelleAutor Chris Halcrow
1

Si vous utilisez NVARCHAR simplement parce qu'une procédure stockée système l'exige, le plus fréquent étant inexplicablement sp_executesql, et votre SQL dynamique est très longue, vous feriez mieux de partir du point de vue des performances de faire toutes les manipulations de chaînes (concaténation, remplacement, etc.) dans VARCHAR puis en convertissant le résultat final NVARCHAR et l'introduire dans le proc paramètre. Donc, non, ne les utilisent pas toujours NVARCHAR!

InformationsquelleAutor ajeh

Vous devez vous connecter pour publier un commentaire.