Type de projet C++: unicode vs multi-octets; avantages et les inconvénients

Je me demandais ce que le Débordement de la Pile de la communauté pense quand il s'agit de la création d'un projet (de la pensée principalement en c++ ici) avec une unicode ou un multi-byte character set.

  • Sont là des pros d'aller Unicode
    directement à partir du début, ce qui implique tous les
    vos chaînes seront en grand format?
    Existe-il des problèmes de performance /de plus grands
    les exigences de mémoire à cause d'un
    utilisation standard d'un grand personnage?

  • Est-il un avantage à cette méthode?
    Faire quelques architectures de processeur
    poignée de caractères larges de mieux?

  • Sont là toutes les raisons de faire votre
    projet Unicode si vous ne prévoyez pas de l'
    prendre en charge d'autres langues?

  • Quelles raisons aurait-on avoir pour la création d'un projet avec un multi-byte character set?

  • Comment faire tous les facteurs ci-dessus entrent en collision dans un milieu à haut rendement (tel qu'un moderne jeu vidéo) ?

  • semble un peu subjectif, aussi un peu comme une question à un professeur pourrait donner. À savoir ces pièces: Quelles raisons aurait-on avoir pour la création d'un projet avec un multi-byte character set? Comment faire tous les facteurs ci-dessus entrent en collision dans un milieu à haut rendement (tel qu'un moderne jeu vidéo) ?
  • "Il n'y a aucune raison de faire de votre projet Unicode si vous ne prévoyez pas de prendre en charge d'autres langues?" Si vous prévoyez sur l'utilisation de caractères avec codepoints entre 128 et 255, oui. Traiter avec les pages de code peut être assez ennuyeux.
  • UTF-8 est un multi-byte character set (de longueur variable de codage de caractères), n'est-il pas? UTF-16 est également une variable de codage de caractères de longueur.
  • Que voulez-vous dire exactement par un multi-byte character set? Tous les codages de caractères qui prennent en charge tous les caractères unicode encoder la plupart des personnages avec plus d'un octet par caractère. Si vous voulez dire une largeur variable de codage alors que cela n'exclut pas la prise en charge unicode. UTF-8 est un très répandue largeur variable de codage de caractères qui prend en charge tous les caractères unicode.
  • Je ne suis pas entièrement sûr, mais je sais que dans le jeu de caractères que vous pouvez spécifier un multi-octets qui prend en charge ANSI ainsi que unicode définit, et de caractères par défaut pour l'ASCII, je crois. Je me demande si ça vaut la peine de la conversion de tout à l'échelle de caractères, essentiellement.
  • La conversion de tout à "l'échelle de caractères" n'est pas la même chose que la prise en charge unicode. Comment prendre en charge unicode dépend vraiment de ce que vous êtes en train de faire et ce que l'Api vous prévoyez d'utiliser.
  • Assurez-vous que vous avez lu ces deux liens; ils peuvent aider à clarifier les raisons de votre titre "unicode vs multi-byte" et "Unicode... ce qui implique toutes vos chaînes seront en format large" sont incorrects: stackoverflow.com/questions/2259544/... et joelonsoftware.com/articles/Unicode.html