Que signifie "RASSEMBLER SQL_Latin1_General_CP1_CI_AS' faire?

J'ai une requête SQL pour créer la base de données dans sql server comme indiqué ci-dessous:

create database yourdb
on
( name = 'yourdb_dat',
  filename = 'c:\program files\microsoft sql server\mssql.1\mssql\data\yourdbdat.mdf',
  size = 25mb,
  maxsize = 1500mb,
  filegrowth = 10mb )
log on
( name = 'yourdb_log',
  filename = 'c:\program files\microsoft sql server\mssql.1\mssql\data\yourdblog.ldf',
  size = 7mb,
  maxsize = 375mb,
  filegrowth = 10mb )
COLLATE SQL_Latin1_General_CP1_CI_AS;
go

Il fonctionne très bien.

Tandis que le reste de la requête SQL est clair pour moi je suis assez confus au sujet de la fonctionnalité de COLLATE SQL_Latin1_General_CP1_CI_AS.

Quelqu'un peut-il m'expliquer cela? Aussi, je voudrais savoir si la création de la base de données de cette façon est une bonne pratique?

InformationsquelleAutor Thunder | 2011-02-18

212

Il définit la façon dont le serveur de base de données les tris. dans ce cas:
```
SQL_Latin1_General_CP1_CI_AS
```
se décompose en parties intéressantes:
1. latin1 rend le serveur de traiter les chaînes de caractères à l'aide de jeu de caractères latin 1, fondamentalement ascii
2. CP1 est synonyme de la Page de Code 1252
3. CI insensible à la casse des comparaisons de sorte de " ABC "serait égal à "abc"
4. AS les accents, donc 'ü' n'est pas égal à 'u'
P. S. Pour de plus amples informations assurez-vous de lire @salomon-rutzky réponse.
- Quelle serait la différence entre le présent et SQL_Latin1_General_CI_AS. Plus précisément, CP1 m'a demande.
- Il ne semble pas être un SQL_Latin1_General_CI_AS. Il est plutôt Latin1_General_CI_AS. Voir SELECT * FROM fn_helpcollations() where name IN ('SQL_Latin1_General_CP1_CI_AS','Latin1_General_CI_AS','SQL_Latin1_General_CI_AS');. Il y a de subtiles différences en ce qui concerne le tri et la comparaison entre les deux classements. Voir olcot.co.royaume-uni/sql-les blogs/....
- CP1 est synonyme de la Page de Code 1252. Une page de code est une table de choix à la carte la valeur hexadécimale d'un caractère spécifique dans un jeu de caractères. CP1 est une abréviation de " CP1252 dans Microsoft sous-culture. Windows est la seule plate-forme qui utilise CP1252 localement, comme c'est un hold-dessus de DOS jours. Si elle est très similaire à la norme ISO 8859-1, ils ne sont pas les mêmes. Il y a des différences dans mappé personnages comme l'euro et quelques autres qui ne sont pas dans la norme ISO 8859-1.
- impeccable réponse @Kris!
InformationsquelleAutor Kris
42

S'il vous plaît être conscient que l'on a accepté la réponse est un peu incomplète. Oui, au niveau le plus élémentaire de Classement des poignées de tri. MAIS, la comparaison des règles définies par l'choisis de Classement sont utilisées dans de nombreux endroits à l'extérieur de l'utilisateur des requêtes sur les données de l'utilisateur.

Si "Ce n' COLLATE SQL_Latin1_General_CP1_CI_AS faire?" signifie "Ce qui ne l' COLLATE clause de CREATE DATABASE faire?", alors:

La COLLATE {collation_name} de la clause de la CREATE DATABASE déclaration spécifie le Classement par défaut de la Base de données, et pas le Serveur de Base de données et le Serveur par défaut au niveau des Classements de contrôle des choses différentes.

Serveur (c'est à dire de l'Instance)-niveau contrôles:
- Niveau de la base de Classement pour les Bases de données système: master, model, msdb, et tempdb.
- En raison du contrôle de la DB-niveau de Classement de tempdb, il est alors le Classement par défaut pour les colonnes de la chaîne dans des tables temporaires (global et local), mais pas les variables de table.
- En raison du contrôle de la DB-niveau de Classement de master, il est alors le Classement utilisé pour au niveau du Serveur de données, tels que les noms de Base de données (c'est à dire name colonne dans sys.databases), les noms de Login, etc.
- Manipulation de paramètre /variable noms
- La manipulation du curseur noms
- Manipulation de GOTO étiquettes
- Classement par défaut utilisé pour les nouvelles Bases de données lors de la COLLATE clause est manquant
Niveau de la base de contrôles:
- Classement par défaut utilisé pour la chaîne nouvellement créée colonnes (CHAR, VARCHAR, NCHAR, NVARCHAR, TEXT, et NTEXT -- mais ne pas utiliser de TEXT ou NTEXT) lorsque le COLLATE clause est absent de la définition de la colonne. Cela vaut pour les deux CREATE TABLE et ALTER TABLE ... ADD consolidés.
- Classement par défaut utilisé pour les littéraux de chaîne (c'est à dire 'some text') et les variables de chaîne de caractères (c'est à dire @StringVariable). Ce Classement est seulement utilisé lors de la comparaison des chaînes de caractères et variables à d'autres chaînes et des variables. Lors de la comparaison des chaînes de caractères /variables pour les colonnes, le Classement de la colonne sera utilisée.
- Le Classement utilisé pour niveau de la Base de méta-données, telles que les noms d'objet (c'est à dire sys.objects), les noms de colonnes (c'est à dire sys.columns), index des noms (c'est à dire sys.indexes), etc.
- Le Classement utilisé pour niveau de la Base de objets: tables, colonnes, index, etc.
Aussi:
- ASCII est un codage à 8 bits (pour l'usage commun; techniquement "ASCII" est de 7 bits avec les valeurs de caractères 0 - 127, et "ASCII Étendu" est de 8 bits avec le caractère des valeurs de 0 à 255). Ce groupe est le même à travers les cultures.
- La Page de Code est "l'étendue" de la part de l'ASCII Étendu, et des contrôles de caractères qui sont utilisées pour les valeurs de 128 à 255. Ce groupe varie entre chaque culture.
- Latin1 ne pas signifie "ASCII" depuis ASCII standard ne couvre que les valeurs de 0 à 127, et tous des pages de code (qui peut être représenté dans SQL Server, et même NVARCHAR) carte ces mêmes 128 valeurs, les mêmes caractères.
Si "Ce n' COLLATE SQL_Latin1_General_CP1_CI_AS faire?" signifie "Qu'est-ce classement ne?", alors:
- Parce que le nom commence par la SQL_, c'est un classement SQL Server, pas un classement Windows. Ce sont définitivement obsolètes, même si ce n'est pas officiellement obsolète, et sont principalement destinés à la pré-compatible avec SQL Server 2000. Bien que, malheureusement SQL_Latin1_General_CP1_CI_AS est très commun en raison de la valeur par défaut lors de l'installation sur un système d'exploitation à l'aide de l'anglais AMÉRICAIN comme de sa langue. Ces classements doivent être évités si possible.
  
  Classements Windows (ceux avec des noms pas de départ avec SQL_) sont plus récents et fonctionnels, de la cohérence des tri entre VARCHAR et NVARCHAR pour les mêmes valeurs, et sont mis à jour supplémentaires /corrigés trier les poids et les majuscules/minuscules mappages. Ces classements n'ont pas le potentiel problème de performance SQL Server classements ont: Impact sur l'Index Lors du Mixage de type VARCHAR et NVARCHAR Types.
- Latin1_General est la culture /locale.
  - Pour NCHAR, NVARCHAR, et NTEXT de données, ce qui détermine les règles linguistiques utilisées pour le tri et la comparaison.
  - Pour CHAR, VARCHAR, et TEXT de données (colonnes, littéraux, et les variables), ce qui détermine l':
    
    règles linguistiques utilisées pour le tri et la comparaison.
    
    page de code utilisée pour coder les caractères. Par exemple, Latin1_General classements utiliser la page de code 1252, Hebrew classements utilisation de code de page 1255, et ainsi de suite.
- CP{code_page} ou {version}
  - Pour SQL Server classements: CP{code_page}, est la 8-bits de code de la page qui détermine quels sont les caractères de la carte à des valeurs de 128 à 255. Bien qu'il existe quatre pages de code pour le Double-Byte Character Sets (sur deux octets DBCS) qui peut utiliser les 2 octets de combinaisons pour créer plus de 256 caractères, ces ne sont pas disponibles pour les classements SQL Server.
  - Pour Windows classements: {version}, tout n'est pas présent dans tous les noms de classement, se réfère à la version de SQL Server dont le classement a été mis en place (pour la plupart). Les classements Windows avec pas de numéro de version dans le nom de la version 80 (sens de SQL Server 2000 qui est de la version 8.0). Pas toutes les versions de SQL Server venir avec les classements de nouveau, donc il y a des lacunes dans les numéros de version. Il ya certains qui sont 90 (pour SQL Server 2005, qui est la version 9.0), la plupart sont 100 (pour SQL Server 2008, version 10.0), et un petit ensemble a 140 (pour SQL Server 2017, la version 14.0).
    
    J'ai dit "pour la plupart" parce que les classements se terminant en _SC ont été introduites dans SQL Server 2012 (version 11.0), mais les données sous-jacentes n'était pas nouveau, ils ont simplement ajouté le support pour les caractères supplémentaires pour les fonctions intégrées. Donc, ces terminaisons existent pour la version 90 et 100 les classements, mais seulement à partir de SQL Server 2012.
- Ensuite, vous avez les sensibilités, qui peuvent être dans n'importe quelle combinaison de ce qui suit, mais toujours précisé dans cet ordre:
  - CS = sensible à la casse ou CI = casse
  - AS = accents ou AI = accents
  - KS = Kana type sensible ou manquant = Kana type insensible
  - WS = largeur sensibles ou manquant = largeur insensible
  - VSS = sélecteur de variante sensible (uniquement disponible dans la version 140 classements) ou manquant = sélecteur de variante insensible
- Facultatif dernier morceau:
  - _SC à la fin signifie "Caractère Complémentaire de soutien". Le "soutien" seulement affecte la façon dont les fonctions intégrées d'interpréter les paires de substitution (qui sont de façon complémentaire, les caractères sont codés en UTF-16). Sans _SC à la fin (ou _140_ dans le milieu), les fonctions intégrées de ne pas voir un seul caractère supplémentaire, mais au lieu de voir deux sens du code points de la paire de substitution. Cette fin peut être ajouté à n'importe quel non-binaire, version 90 ou 100 classement.
  - _BIN ou _BIN2 à la fin signifie "binaire", de tri et de comparaison. Les données sont toujours stockées de la même, mais il n'existe pas de règles linguistiques. Cette fin n'est jamais associée avec l'une des 5 des sensibilités ou des _SC. _BIN est l'ancien style, et _BIN2 est le plus récent, le plus précis de style. Si vous utilisez SQL Server 2005 ou plus récent, l'utilisation _BIN2. Pour plus de détails sur les différences entre _BIN et _BIN2, veuillez consulter: Les différences Entre les Divers Classements Binaires (les Cultures, les Versions, et BIN vs BIN2).
  - _UTF8 est une nouvelle option de SQL Server 2019. C'est une 8-bits de codage qui permet pour l'Unicode des données stockées dans VARCHAR et CHAR types de données (mais pas le obsolète TEXT type de données). Cette option peut être utilisée uniquement sur les classements qui prennent en charge les caractères supplémentaires (c'est à dire la version 90 ou 100 classements avec _SC en leur nom, le nom et la version de 140 classements). Il y a aussi un seul binaire _UTF8 classement (_BIN2, pas _BIN).
    
    VEUILLEZ NOTER: UTF-8 a été conçu et réalisé pour la compatibilité avec les environnements /code qui sont mis en place pour les 8-bits codages encore envie de support de l'Unicode. Même si il ya quelques scénarios où l'UTF-8 peut fournir jusqu'à 50% de gain de place par rapport à NVARCHAR, qui est un effet secondaire et a un coût d'un léger coup à la performance dans beaucoup de /la plupart des opérations. Si vous en avez besoin pour la compatibilité, alors le coût est acceptable. Si vous voulez de l'espace d'épargne, vous feriez mieux de le tester, et TESTER à NOUVEAU. De test comprend toutes les fonctionnalités, et bien plus que quelques lignes de données. Soyez averti que l'UTF-8 classements fonctionnent mieux lorsque TOUTES les colonnes, et la base de données elle-même, sont à l'aide de VARCHAR de données (colonnes, les variables, les littéraux de chaîne) avec un _UTF8 classement. C'est l'état naturel pour toute personne utilisant ce pour la compatibilité, mais pas pour ceux qui veulent l'utiliser pour l'espace d'épargne. Soyez prudent lors du mélange de données VARCHAR à l'aide d'un _UTF8 classement avec soit VARCHAR données à l'aide de non-_UTF8 classements ou NVARCHAR de données, que vous pouvez rencontrer un comportement étrange /la perte de données. Pour plus de détails sur la nouvelle UTF-8 classements, voir: Natif de l'UTF-8 est pris en charge dans SQL Server 2019: Sauveur ou Faux Prophète?
- Alors que je n'ai upvote ce pour contenant autant d'informations et d'efforts, Ma réponse est certainement pas de mal (bases de données banque de données, serveurs de base de données agir sur ces données, le tri est d'agir). J'ai choisi la brièveté cours complet de mathématiques de précision parce que l'OP a probablement été à la recherche pour assez, pas tous les renseignements possibles.
- Salut @Kris. Merci. Pour être honnête, je n'ai pas dit que votre réponse était totalement faux, juste malheureusement incomplète. J'ai mis à jour l'espoir de préciser que. Je reçois ce que vous dites, mais l'OP a demandé à ce que le COLLATE clause de CREATE DATABASE n'. Vous avez dit plusieurs choses qu'il fait. Pourquoi supposez-vous que l'OP veut seulement savoir 10% de la réponse? Si toutes les informations sont présentées, chaque personne peut décider de la quantité à prendre. Mais si seulement une partie de l'info est donnée, le choix a été fait pour eux. - Je choisir de fournir autant d'informations que possible, parce que la plupart de c'est pas bien connue. (suite)
- Quand il s'agit de Classements (et les codages) la plupart de ce qu'il est incomplet ou incorrect. Ainsi, la plupart des gens à pied, sans le savoir assez, ou de penser qu'ils savent quelque chose, mais d'être tout à fait tort. Les gens à prendre de meilleures décisions quand ils ont tous de l'info, donc je trouve qu'il vaut mieux offrir comme complète d'une réponse possible. Par le choix de la brièveté, vous pouvez potentiellement laisser les lecteurs confus quand ils obtiennent des erreurs d'analyse, etc dans un DB en cas de casse ou de Classement binaire, parce que la résolution de nom n'était pas mentionné. Ainsi, alors que vous avez raison sur le tri, j'ai l'impression qu'en lui-même, il est trompeur.
- Je pense que je vois ce que tu veux dire, mais j'ai pour objectif de donner suffisamment d'informations, plutôt que trop. trop rapidement à l'information devient trop compliqué pour beaucoup de gens. et quand je n'ai pas donner assez d'informations pour toute circonstance je vais attendre de suivi des questions. (J'ai aussi ne vous attendez pas tout à fait ce beaucoup d'attention à la rubrique)
- J'ai été à la sens pendant un certain temps de dire "Merci!" pour montrer une telle maturité et de professionnalisme. Je suis un peu habitué aux gens qui prennent des personnels en déplaise à quelqu'un de dire qu'ils sont mauvais, puis devient "difficile" (ou plus difficile) à interagir avec. Mais, votre réponse mesurée à mon, "la accepté réponse est MAL" m'a inspiré pour calmer mon intro, et devrait servir d'exemple à d'autres ici sur la façon de communiquer correctement et de manière productive .
- Vous êtes les bienvenus et agréable à entendre, j'ai fait un impact positif, mais j'apprécie d'être "mauvais", il ouvre des possibilités d'apprendre de nouvelles choses, ce qui est excellent!
InformationsquelleAutor Solomon Rutzky
23

La CP1, signifie "de la Page de Code de 1' -, techniquement, cela se traduit par la page de code 1252

InformationsquelleAutor Chris Halcrow
15

La RASSEMBLER mot clé de spécifier quel type de jeu de caractères et les règles de l'ordre, de la confrontation des règles) que vous utilisez pour les valeurs de chaîne.

Par exemple, dans votre cas, vous utilisez latine, les règles avec de la casse (CI) et les accents (COMME)

Vous pouvez vous référer à ce La Documentation

InformationsquelleAutor il_guru
8

Indique le classement par défaut de la base de données. Chaque champ de texte que vous créez dans les tables dans la base de données, utilisez ce classement, sauf si vous spécifiez un autre.

Une base de données a toujours un classement par défaut. Si vous ne spécifiez pas tout, le classement par défaut de l'instance de SQL Server est utilisé.

Le nom de la collation que vous utilisez montre qu'il utilise le codage Latin1 code de la page 1, est insensible à la casse (CI) et les accents (COMME). Ce classement est utilisé aux états-unis, de sorte qu'il contiendra des règles de tri qui sont utilisés dans les états-unis.

Le classement décide de la façon dont les valeurs de texte sont comparés pour l'égalité et la ressemblance, et comment ils sont comparés lors du tri. Le code de page est utilisé lors de l'entreposage de données non-unicode, par exemple, les champs varchar.
- mal (vous ne pouvez pas not spécifier un classement, même si vous pouvez accepter la valeur par défaut) mauvais (il est utilisé pour les données unicode trop)
- aka cyberkiwi: consultez la documentation: msdn.microsoft.com/en-us/library/ms176061.aspx en Précisant le classement de est en option. Le code de la page n'est pas utilisé pour le stockage des données Unicode, qui est stockée en tant que 16 bits points de code Unicode, pas que les 8 bits de code de la page index.
- J'ai lu votre réponse erronée, mais il est toujours mal. Une base de données a toujours un classement par défaut = classement du SERVEUR, pas spécifiquement Latin1_General_CI_AS. Maintenant que j'ai lu il mauvais parce que je m'attendais à l'instruction concernant classement du SERVEUR qui ne requièrent l'acceptation de défaut dans l'INTERFACE utilisateur. Pour le 2ème point, vous semblez impliquent ce classement est pas utilisé pour le tri de données unicode (même si vous passez de sorting à storing dans les 2 dernières phrases). Texte Unicode données obéit aussi des classements.
- aka cyberkiwi: j'ai modifié le paragraphe sur le classement par défaut de correspondre avec la documentation spécifique que j'ai liée. (Il diffère selon la version de serveur.) Concernant le deuxième point, je ne vois pas comment je pourrais le rendre plus clair. Le texte dit que le code de la page est utilisé lors de la stockage de données non-unicode. Une page de code n'est pas utilisé pour déterminer le tri, ni pour les données unicode, ni pour les données non-unicode.
InformationsquelleAutor Guffa

Vous devez vous connecter pour publier un commentaire.

Que signifie "RASSEMBLER SQL_Latin1_General_CP1_CI_AS' faire?

Si "Ce n' `COLLATE SQL_Latin1_General_CP1_CI_AS` faire?" signifie "Ce qui ne l' `COLLATE` clause de `CREATE DATABASE` faire?", alors:

Si "Ce n' `COLLATE SQL_Latin1_General_CP1_CI_AS` faire?" signifie "Qu'est-ce classement ne?", alors:

Si "Ce n' COLLATE SQL_Latin1_General_CP1_CI_AS faire?" signifie "Ce qui ne l' COLLATE clause de CREATE DATABASE faire?", alors:

Si "Ce n' COLLATE SQL_Latin1_General_CP1_CI_AS faire?" signifie "Qu'est-ce classement ne?", alors:

Si "Ce n' `COLLATE SQL_Latin1_General_CP1_CI_AS` faire?" signifie "Ce qui ne l' `COLLATE` clause de `CREATE DATABASE` faire?", alors:

Si "Ce n' `COLLATE SQL_Latin1_General_CP1_CI_AS` faire?" signifie "Qu'est-ce classement ne?", alors: