Supprimer les accents/caractères diacritiques dans une chaîne de caractères en JavaScript

Comment puis-je supprimer des caractères accentués à partir d'une chaîne?
Surtout dans IE6, j'ai eu quelque chose comme ceci:

accentsTidy = function(s){
    var r=s.toLowerCase();
    r = r.replace(new RegExp(/\s/g),"");
    r = r.replace(new RegExp(/[àáâãäå]/g),"a");
    r = r.replace(new RegExp(/æ/g),"ae");
    r = r.replace(new RegExp(/ç/g),"c");
    r = r.replace(new RegExp(/[èéêë]/g),"e");
    r = r.replace(new RegExp(/[ìíîï]/g),"i");
    r = r.replace(new RegExp(/ñ/g),"n");                
    r = r.replace(new RegExp(/[òóôõö]/g),"o");
    r = r.replace(new RegExp(/œ/g),"oe");
    r = r.replace(new RegExp(/[ùúûü]/g),"u");
    r = r.replace(new RegExp(/[ýÿ]/g),"y");
    r = r.replace(new RegExp(/\W/g),"");
    return r;
};

mais IE6 qui me dérange, il semble qu'il n'aime pas mon expression régulière.

pourquoi sur terre serait vous voulez supprimer les accents? Cela ressemble à une sorte de forcé l'Anglicisation de noms.... et un pauvre à qui. '山田太郎" serait juste de devenir une chaîne vide.
Je veux trier par ordre alphabétique dans un véritable ordre alphabétique, sans avoir les lettres accentuées systématiquement à la fin. Je Peux ? (Et je suis français, donc anglicisation... 🙂 )
Les réponses ici semblent ignorer la question de la normalisation. Une solution robuste qui vous auriez à chercher à faire le genre de choses qui sont effectuées par des github.com/walling/unorm .
Certains logiciels ne permettent pas de caractères spéciaux dans un id d'emplacement. (PAGE HTML NOMS par exemple) C'est une autre raison de vouloir les supprimer. Garder le titre dans sa forme originale, mais ne pas avoir à retaper tous ces personnages.
votre exemple serait formidable pour la validation, mais pas de désinfection. Si la chaîne de caractères qu'un utilisateur saisit a des limites, ils ont besoin de savoir cela et être invité à entrer la chaîne de caractères avec les contraintes prévues. L'OP est en fait juste pour le tri et pas pour des changements permanents pour les données. OP serait probablement bénéficier de tri à l'aide de la localeCompare() méthode qui va vous permettre de trier les chaînes en fonction des paramètres régionaux du navigateur (pour la même raison à l'utilisation toLocaleString() lorsque l'on travaille avec les dates)
avez-vous essayé d'utiliser localeCompare ? "ca".localeCompare("ça") me donne -132 dans google Chrome. Le navigateur de paramètres régionaux ne vous dira jamais que "c" est égal à "ç". Et c'est très bien, car il ne devrait pas. Ils sont en effet différents.
J'ai fouillé un peu plus sur la question. La spécification de ne pas appliquer quelque chose au sujet de la locale (je ne peux pas savoir ce que le navigateur va le faire), mais recommande que les navigateurs transcrire la chaîne de caractères en Unicode Forme Normalisée (unicode.org/reports/tr15/#Norm_Forms). Dans cette forme de "ç" est traduit dans le caractère 'c' plus le caractère 'cédille'. Ce n'est pas ce que je veux.
Je ne suis pas sûr que cela travail dans ma situation, étant donné que l'utilisateur est entré dans le titre requis est le titre de l'article. Il serait déraisonnable pour moi de leur demander de modifier leur titre (sauf peut-être si ils ont écrit des articles au sujet de l'encodage) Mais leur "C est la vie." - c'est leur titre, j'ai besoin que les données, juste mes modifications de la structure à à "cest_la_vie".. ne sais Pas si je suis clair mais c'est mon affaire, probablement rien à voir avec l'OP
Possible dup stackoverflow.com/questions/863800/...
Ceci est très utile pour les recherches de trop. Je suis en train de construire une recherche d'entrée de boîte où vous tapez joueur de football les noms de tous les coins du monde et je veux d'auto-complétion. Devinez ce que dans ma langue, il n'y a pas de signes diacritiques il est donc difficile pour moi de taper des noms comme "López" ou "Óscar'
IE6 problème peut être dû au fait que RE d'origine constructeur arguments sont censés être des chaînes de caractères ("PATTERN" [, flags]) new RegExp("ab+c", "g"); et déjà créé objet regexp source
Cela est inexact, puisque vous êtes seulement sur certains des caractères accentués. Par exemple, si seulement compter avec des signes diacritiques, nous avons une longue liste de "áàăắằẵẳaáàâǎâấầẫẩaǎaaaåǻåäääääǟãããaȧȧǡąąąąąąąąąąāąąąąąąāāāāāā aáàâäāåảȁȃạạạặậạạạḁⱥaᶏɑɑɑaᶐ" et il n'est pas encore la liste complète. En outre, le dictionnaire n'est pas la même dans toutes les langues. Par exemple tchèque envisager CH un caractère distinct et de le mettre juste après H. Certaines langues comme le norvégien mettre les caractères accentués "æøå" à la fin de l'alphabet au lieu
Dans les vieux jours CH est également une lettre en espagnol alphabet placé après le C, CH sera après CZ. Donc enlever tous les signes diacritiques et de tri n'est pas une bonne façon d'aller.
Voici un cas d'utilisation: Dans geocaching.com/geocache/... il est le code utilisé dans l'énigme avec une opération demandant de remplacer les lettres par des nombres A=1, B=2, C=3, ... puis ajouter chacun de ces numéros. Dans ce code, É sera de 5 aussi, comme l'E.
La meilleure façon serait pour tout le monde pour réaliser que a et a with something est encore un a ... et supprimer l'ensemble "diacritique lettres de lettres!" chose du monde... malheureusement, je doute que cela va être fait, mais l'espoir meurt en dernier...
Double Possible de Efficacement remplacer tous les caractères accentués dans une chaîne de caractères?
Pensez à mettre à jour votre réponse pour ma réponse qui est plus up-to-date/actuel, à l'aide de ES6.
L'on a accepté la réponse est obsolète et il y a une BIEN meilleure solution énumérés ci-dessous. Les gens peuvent venir sur cette page et en fait utiliser cette solution. Veuillez mettre à jour votre réponse.
Ceci est un XY problème! Si vous êtes en essayant de trier des chaînes de caractères comme e < é < f, puis vous effectuez Unicode classement — de sorte que vous devriez utiliser l' (personnalisable, dépendant de paramètres régionaux) Unicode collation algorithm, mis en œuvre par le Intl.Collator en JavaScript.
Sûr, mais quand la question a été posée, je ne sais pas ce que je doit attendre 3 ans pour l'Intl.Collateur de spec à être défini.
Compte tenu de l'état JS était en 2009, vous n'êtes pas du tout dans le mauvais. Mais je pense que de très nombreux Googlers va se retrouver avec le même objectif que le vôtre (quelle autre raison est là pour éliminer les signes diacritiques?) et il vaut la peine de mentionner que Intl.Collator existe maintenant de résoudre le X problème, tout comme @LewisDiamond mentionné que normalize('NFD') existe maintenant de résoudre le Y problème.
convenu Intl.Collateur est probablement ce que l'OP a été à la recherche pour. J'ai ajouté l'info à ma réponse à assurez-vous que les gens ont deux options en fonction de ce dont ils ont besoin.
pourquoi faites-vous new RegExp(/foo/g) au lieu de simplement /foo/g (ce qui crée une instance de RegExp?

InformationsquelleAutor glmxndr | 2009-06-13

diacritics javascript

570

Avec ES2015/ES6 Chaîne de caractères.Le Prototype.Normalize(),
```
const str = "Crème Brulée"
str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")
> "Creme Brulee"
```
Deux il se passe des choses ici:
1. normalize()ing NFD Unicode forme normale se décompose combiné graphèmes dans la combinaison de plus simple. Le è de Crème finit exprimé en e + ̀.
2. À l'aide d'une regex classe de personnage pour correspondre à la U+0300 → U+036F gamme, il est désormais banal de globally se débarrasser des signes diacritiques, qui le standard Unicode idéalement groupes comme le La Combinaison Des Signes Diacritiques blocs Unicode.
Voir le commentaire de l'essai de performance.

Alternativement, si vous voulez juste de tri

Intl.Collateur a suffisamment de soutien ~85% dès maintenant, un polyfill est également disponible ici mais je n'ai pas testé.
```
const c = new Intl.Collator();
["creme brulee", "crème brulée", "crame brulai", "crome brouillé",
"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)
["crame brulai", "creme brulay", "creme bruléa", "creme brulee",
"crème brulée", "creme brulfé", "crome brouillé"]


["creme brulee", "crème brulée", "crame brulai", "crome brouillé"].sort((a,b) => a>b)
["crame brulai", "creme brulee", "crome brouillé", "crème brulée"]
```
- Il y a un polyfill disponibles pour normaliser pour les pauvres âmes qui ne peuvent pas utiliser ECMAScript 6. github.com/walling/unorm
- ici un jsperf avec quoi? jsperf.com/normalizeremovediacretics3 il semble être vraiment rapide
- Ressemble à une solution correcte pour l'es6.
- Cette solution est la seule solution correcte ici. Cela fonctionne sur NodeJS 4.6, Firefox 50 et Chrome 54.
- Il y a toujours un char qui échoue.. 'ąśćńżółźćę'.normalize('NFD').replace(/[\u0300-\u036f]/g, "") -> ascnzołzce (manque le match pour ł -> l).
- Corrigez-moi si je me trompe, mais ł est une lettre en lui-même, pas un caractère accentué L. Par conséquent, il ne devrait pas être modifié pour l.
- l'ł ne tombe pas dans le caractère de classe de la gamme. Vous pouvez cibler précisément comme \u0142 ---SI---> 'ł'.replace(/\u0142/g, "l")
- Merci, je voulais juste faire remarquer. Bien sûr, vous avez raison, c'est une lettre, pas un caractère accentué L.
- Si vous voulez trier, de les utiliser Intl.Assembler avec les bonnes locales. Je ne sais pas comment cette lettre sortes de polonais, mais il devrait fonctionner.
- Attention, la normalisation n'est pas pris en charge sur tous les navigateurs. Je l'ai eu un crash sur une Réagir application en cours d'exécution sur Android, j'ai utilisé à la place limer de lodash
- comme indiqué ci-dessus, il y a un polyfill github.com/walling/unorm
- pour info, il ne remplacera pas æø
- ae en.wikipedia.org/wiki/%C3%86 ø en.wikipedia.org/wiki/%C3%98 sont les lettres, pas les lettres accentuées.
- ébavurer fonctionne pas avec l'UTF8 cordes. Seulement avec le latin-1 chaînes :/
- Juste un peu plus d'informations concernant les Formes de Normalisation Unicode => unicode.org/reports/tr15/#Norm_Forms
InformationsquelleAutor Lewis Diamond

241

J'ai légèrement modifié khel version pour une raison: Tous les regexp analyser/remplacer coût O(n) opérations, où n est le nombre de caractères dans le texte cible. Mais, regexp n'est pas exactement ce dont nous avons besoin. Donc:

JS:

/*
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
*/
var defaultDiacriticsRemovalMap = [
{'base':'A', 'letters':'\u0041\u24B6\uFF21\u00C0\u00C1\u00C2\u1EA6\u1EA4\u1EAA\u1EA8\u00C3\u0100\u0102\u1EB0\u1EAE\u1EB4\u1EB2\u0226\u01E0\u00C4\u01DE\u1EA2\u00C5\u01FA\u01CD\u0200\u0202\u1EA0\u1EAC\u1EB6\u1E00\u0104\u023A\u2C6F'},
{'base':'AA','letters':'\uA732'},
{'base':'AE','letters':'\u00C6\u01FC\u01E2'},
{'base':'AO','letters':'\uA734'},
{'base':'AU','letters':'\uA736'},
{'base':'AV','letters':'\uA738\uA73A'},
{'base':'AY','letters':'\uA73C'},
{'base':'B', 'letters':'\u0042\u24B7\uFF22\u1E02\u1E04\u1E06\u0243\u0182\u0181'},
{'base':'C', 'letters':'\u0043\u24B8\uFF23\u0106\u0108\u010A\u010C\u00C7\u1E08\u0187\u023B\uA73E'},
{'base':'D', 'letters':'\u0044\u24B9\uFF24\u1E0A\u010E\u1E0C\u1E10\u1E12\u1E0E\u0110\u018B\u018A\u0189\uA779\u00D0'},
{'base':'DZ','letters':'\u01F1\u01C4'},
{'base':'Dz','letters':'\u01F2\u01C5'},
{'base':'E', 'letters':'\u0045\u24BA\uFF25\u00C8\u00C9\u00CA\u1EC0\u1EBE\u1EC4\u1EC2\u1EBC\u0112\u1E14\u1E16\u0114\u0116\u00CB\u1EBA\u011A\u0204\u0206\u1EB8\u1EC6\u0228\u1E1C\u0118\u1E18\u1E1A\u0190\u018E'},
{'base':'F', 'letters':'\u0046\u24BB\uFF26\u1E1E\u0191\uA77B'},
{'base':'G', 'letters':'\u0047\u24BC\uFF27\u01F4\u011C\u1E20\u011E\u0120\u01E6\u0122\u01E4\u0193\uA7A0\uA77D\uA77E'},
{'base':'H', 'letters':'\u0048\u24BD\uFF28\u0124\u1E22\u1E26\u021E\u1E24\u1E28\u1E2A\u0126\u2C67\u2C75\uA78D'},
{'base':'I', 'letters':'\u0049\u24BE\uFF29\u00CC\u00CD\u00CE\u0128\u012A\u012C\u0130\u00CF\u1E2E\u1EC8\u01CF\u0208\u020A\u1ECA\u012E\u1E2C\u0197'},
{'base':'J', 'letters':'\u004A\u24BF\uFF2A\u0134\u0248'},
{'base':'K', 'letters':'\u004B\u24C0\uFF2B\u1E30\u01E8\u1E32\u0136\u1E34\u0198\u2C69\uA740\uA742\uA744\uA7A2'},
{'base':'L', 'letters':'\u004C\u24C1\uFF2C\u013F\u0139\u013D\u1E36\u1E38\u013B\u1E3C\u1E3A\u0141\u023D\u2C62\u2C60\uA748\uA746\uA780'},
{'base':'LJ','letters':'\u01C7'},
{'base':'Lj','letters':'\u01C8'},
{'base':'M', 'letters':'\u004D\u24C2\uFF2D\u1E3E\u1E40\u1E42\u2C6E\u019C'},
{'base':'N', 'letters':'\u004E\u24C3\uFF2E\u01F8\u0143\u00D1\u1E44\u0147\u1E46\u0145\u1E4A\u1E48\u0220\u019D\uA790\uA7A4'},
{'base':'NJ','letters':'\u01CA'},
{'base':'Nj','letters':'\u01CB'},
{'base':'O', 'letters':'\u004F\u24C4\uFF2F\u00D2\u00D3\u00D4\u1ED2\u1ED0\u1ED6\u1ED4\u00D5\u1E4C\u022C\u1E4E\u014C\u1E50\u1E52\u014E\u022E\u0230\u00D6\u022A\u1ECE\u0150\u01D1\u020C\u020E\u01A0\u1EDC\u1EDA\u1EE0\u1EDE\u1EE2\u1ECC\u1ED8\u01EA\u01EC\u00D8\u01FE\u0186\u019F\uA74A\uA74C'},
{'base':'OI','letters':'\u01A2'},
{'base':'OO','letters':'\uA74E'},
{'base':'OU','letters':'\u0222'},
{'base':'OE','letters':'\u008C\u0152'},
{'base':'oe','letters':'\u009C\u0153'},
{'base':'P', 'letters':'\u0050\u24C5\uFF30\u1E54\u1E56\u01A4\u2C63\uA750\uA752\uA754'},
{'base':'Q', 'letters':'\u0051\u24C6\uFF31\uA756\uA758\u024A'},
{'base':'R', 'letters':'\u0052\u24C7\uFF32\u0154\u1E58\u0158\u0210\u0212\u1E5A\u1E5C\u0156\u1E5E\u024C\u2C64\uA75A\uA7A6\uA782'},
{'base':'S', 'letters':'\u0053\u24C8\uFF33\u1E9E\u015A\u1E64\u015C\u1E60\u0160\u1E66\u1E62\u1E68\u0218\u015E\u2C7E\uA7A8\uA784'},
{'base':'T', 'letters':'\u0054\u24C9\uFF34\u1E6A\u0164\u1E6C\u021A\u0162\u1E70\u1E6E\u0166\u01AC\u01AE\u023E\uA786'},
{'base':'TZ','letters':'\uA728'},
{'base':'U', 'letters':'\u0055\u24CA\uFF35\u00D9\u00DA\u00DB\u0168\u1E78\u016A\u1E7A\u016C\u00DC\u01DB\u01D7\u01D5\u01D9\u1EE6\u016E\u0170\u01D3\u0214\u0216\u01AF\u1EEA\u1EE8\u1EEE\u1EEC\u1EF0\u1EE4\u1E72\u0172\u1E76\u1E74\u0244'},
{'base':'V', 'letters':'\u0056\u24CB\uFF36\u1E7C\u1E7E\u01B2\uA75E\u0245'},
{'base':'VY','letters':'\uA760'},
{'base':'W', 'letters':'\u0057\u24CC\uFF37\u1E80\u1E82\u0174\u1E86\u1E84\u1E88\u2C72'},
{'base':'X', 'letters':'\u0058\u24CD\uFF38\u1E8A\u1E8C'},
{'base':'Y', 'letters':'\u0059\u24CE\uFF39\u1EF2\u00DD\u0176\u1EF8\u0232\u1E8E\u0178\u1EF6\u1EF4\u01B3\u024E\u1EFE'},
{'base':'Z', 'letters':'\u005A\u24CF\uFF3A\u0179\u1E90\u017B\u017D\u1E92\u1E94\u01B5\u0224\u2C7F\u2C6B\uA762'},
{'base':'a', 'letters':'\u0061\u24D0\uFF41\u1E9A\u00E0\u00E1\u00E2\u1EA7\u1EA5\u1EAB\u1EA9\u00E3\u0101\u0103\u1EB1\u1EAF\u1EB5\u1EB3\u0227\u01E1\u00E4\u01DF\u1EA3\u00E5\u01FB\u01CE\u0201\u0203\u1EA1\u1EAD\u1EB7\u1E01\u0105\u2C65\u0250'},
{'base':'aa','letters':'\uA733'},
{'base':'ae','letters':'\u00E6\u01FD\u01E3'},
{'base':'ao','letters':'\uA735'},
{'base':'au','letters':'\uA737'},
{'base':'av','letters':'\uA739\uA73B'},
{'base':'ay','letters':'\uA73D'},
{'base':'b', 'letters':'\u0062\u24D1\uFF42\u1E03\u1E05\u1E07\u0180\u0183\u0253'},
{'base':'c', 'letters':'\u0063\u24D2\uFF43\u0107\u0109\u010B\u010D\u00E7\u1E09\u0188\u023C\uA73F\u2184'},
{'base':'d', 'letters':'\u0064\u24D3\uFF44\u1E0B\u010F\u1E0D\u1E11\u1E13\u1E0F\u0111\u018C\u0256\u0257\uA77A'},
{'base':'dz','letters':'\u01F3\u01C6'},
{'base':'e', 'letters':'\u0065\u24D4\uFF45\u00E8\u00E9\u00EA\u1EC1\u1EBF\u1EC5\u1EC3\u1EBD\u0113\u1E15\u1E17\u0115\u0117\u00EB\u1EBB\u011B\u0205\u0207\u1EB9\u1EC7\u0229\u1E1D\u0119\u1E19\u1E1B\u0247\u025B\u01DD'},
{'base':'f', 'letters':'\u0066\u24D5\uFF46\u1E1F\u0192\uA77C'},
{'base':'g', 'letters':'\u0067\u24D6\uFF47\u01F5\u011D\u1E21\u011F\u0121\u01E7\u0123\u01E5\u0260\uA7A1\u1D79\uA77F'},
{'base':'h', 'letters':'\u0068\u24D7\uFF48\u0125\u1E23\u1E27\u021F\u1E25\u1E29\u1E2B\u1E96\u0127\u2C68\u2C76\u0265'},
{'base':'hv','letters':'\u0195'},
{'base':'i', 'letters':'\u0069\u24D8\uFF49\u00EC\u00ED\u00EE\u0129\u012B\u012D\u00EF\u1E2F\u1EC9\u01D0\u0209\u020B\u1ECB\u012F\u1E2D\u0268\u0131'},
{'base':'j', 'letters':'\u006A\u24D9\uFF4A\u0135\u01F0\u0249'},
{'base':'k', 'letters':'\u006B\u24DA\uFF4B\u1E31\u01E9\u1E33\u0137\u1E35\u0199\u2C6A\uA741\uA743\uA745\uA7A3'},
{'base':'l', 'letters':'\u006C\u24DB\uFF4C\u0140\u013A\u013E\u1E37\u1E39\u013C\u1E3D\u1E3B\u017F\u0142\u019A\u026B\u2C61\uA749\uA781\uA747'},
{'base':'lj','letters':'\u01C9'},
{'base':'m', 'letters':'\u006D\u24DC\uFF4D\u1E3F\u1E41\u1E43\u0271\u026F'},
{'base':'n', 'letters':'\u006E\u24DD\uFF4E\u01F9\u0144\u00F1\u1E45\u0148\u1E47\u0146\u1E4B\u1E49\u019E\u0272\u0149\uA791\uA7A5'},
{'base':'nj','letters':'\u01CC'},
{'base':'o', 'letters':'\u006F\u24DE\uFF4F\u00F2\u00F3\u00F4\u1ED3\u1ED1\u1ED7\u1ED5\u00F5\u1E4D\u022D\u1E4F\u014D\u1E51\u1E53\u014F\u022F\u0231\u00F6\u022B\u1ECF\u0151\u01D2\u020D\u020F\u01A1\u1EDD\u1EDB\u1EE1\u1EDF\u1EE3\u1ECD\u1ED9\u01EB\u01ED\u00F8\u01FF\u0254\uA74B\uA74D\u0275'},
{'base':'oi','letters':'\u01A3'},
{'base':'ou','letters':'\u0223'},
{'base':'oo','letters':'\uA74F'},
{'base':'p','letters':'\u0070\u24DF\uFF50\u1E55\u1E57\u01A5\u1D7D\uA751\uA753\uA755'},
{'base':'q','letters':'\u0071\u24E0\uFF51\u024B\uA757\uA759'},
{'base':'r','letters':'\u0072\u24E1\uFF52\u0155\u1E59\u0159\u0211\u0213\u1E5B\u1E5D\u0157\u1E5F\u024D\u027D\uA75B\uA7A7\uA783'},
{'base':'s','letters':'\u0073\u24E2\uFF53\u00DF\u015B\u1E65\u015D\u1E61\u0161\u1E67\u1E63\u1E69\u0219\u015F\u023F\uA7A9\uA785\u1E9B'},
{'base':'t','letters':'\u0074\u24E3\uFF54\u1E6B\u1E97\u0165\u1E6D\u021B\u0163\u1E71\u1E6F\u0167\u01AD\u0288\u2C66\uA787'},
{'base':'tz','letters':'\uA729'},
{'base':'u','letters': '\u0075\u24E4\uFF55\u00F9\u00FA\u00FB\u0169\u1E79\u016B\u1E7B\u016D\u00FC\u01DC\u01D8\u01D6\u01DA\u1EE7\u016F\u0171\u01D4\u0215\u0217\u01B0\u1EEB\u1EE9\u1EEF\u1EED\u1EF1\u1EE5\u1E73\u0173\u1E77\u1E75\u0289'},
{'base':'v','letters':'\u0076\u24E5\uFF56\u1E7D\u1E7F\u028B\uA75F\u028C'},
{'base':'vy','letters':'\uA761'},
{'base':'w','letters':'\u0077\u24E6\uFF57\u1E81\u1E83\u0175\u1E87\u1E85\u1E98\u1E89\u2C73'},
{'base':'x','letters':'\u0078\u24E7\uFF58\u1E8B\u1E8D'},
{'base':'y','letters':'\u0079\u24E8\uFF59\u1EF3\u00FD\u0177\u1EF9\u0233\u1E8F\u00FF\u1EF7\u1E99\u1EF5\u01B4\u024F\u1EFF'},
{'base':'z','letters':'\u007A\u24E9\uFF5A\u017A\u1E91\u017C\u017E\u1E93\u1E95\u01B6\u0225\u0240\u2C6C\uA763'}
];
var diacriticsMap = {};
for (var i=0; i < defaultDiacriticsRemovalMap .length; i++){
var letters = defaultDiacriticsRemovalMap [i].letters;
for (var j=0; j < letters.length ; j++){
diacriticsMap[letters[j]] = defaultDiacriticsRemovalMap [i].base;
}
}
//"what?" version ... http://jsperf.com/diacritics/12
function removeDiacritics (str) {
return str.replace(/[^\u0000-\u007E]/g, function(a){ 
return diacriticsMap[a] || a; 
});
}    
var paragraph = "L'avantage d'utiliser le lorem ipsum est bien     évidemment de pouvoir créer des maquettes ou de remplir un site internet de contenus qui présentent un rendu s'approchant un maximum du rendu final. \n Par défaut lorem ipsum ne contient pas d'accent ni de caractères spéciaux contrairement à la langue française qui en contient beaucoup. C'est sur ce critère que nous proposons une solution avec cet outil qui générant du faux-texte lorem ipsum mais avec en plus, des caractères spéciaux tel que les accents ou certains symboles utiles pour la langue française. \n L'utilisation du lorem standard est facile d’utilisation mais lorsque le futur client utilisera votre logiciel il se peut que certains caractères spéciaux ou qu'un accent ne soient pas codés correctement. \n Cette page a pour but donc de pouvoir perdre le moins de temps possible et donc de tester directement si tous les encodages de base de donnée ou des sites sont les bons de plus il permet de récuperer un code css avec le texte formaté !";
alert(removeDiacritics(paragraph));

Pour tester ma théorie, j'ai écrit un test en http://jsperf.com/diacritics/12. Résultats:

Tests en Chrome 28.0.1500.95 32 bits sur Windows 8 64-bit:

À L'Aide De Regexp

4,558 ops/sec ±4.16%. 37% plus lent

Le Générateur de chaîne de style

7,308 ops/sec ±4.88%. plus rapide

Mise à jour

Tests en Chrome 33.0.1750 sur Windows 8 64-bit:

Utilisation Des Regexp

5,260 ±1.25% ops/sec 76% plus lent

À l'aide de @skerit version

22,138 ±2.12% ops/sec plus rapide

Mise à jour - 19/03/2014

Ajoutant manquant "OE" les signes diacritiques.

Mise à jour - 27/03/2014

À l'aide d'un moyen plus rapide à travers une chaîne à l'aide de js - "Quoi?" Version

Supprimer les accents/caractères diacritiques dans une chaîne de caractères en JavaScript

Mise à jour - 14/05/2014

Wiki de la communauté

J'ai ajouté deux variations, mais ils ne sont pas plus rapide que la Chaîne Builder version (testé avec Chrome et Firefox): jsperf.com/diacritics/3
J'ai ajouté une autre variante sans l'aide de "en". Sérieusement: n'utilisez pas "in", c'est incroyablement lent.
Comme @skerit a recommandé, on doit éviter d'utiliser l'opérateur "in" pour savoir si une clé est présente dans le Tableau. Ressemble, JS moteur transversal à tous les tableau de savoir si la clé est là. Je suis vraiment penser que mettre cette réponse que la version communautaire.
removeDiacritics('Rügen') -> "Rügen' 🙁
essayer ici ... jsfiddle.net/SxDA6
Je ne pouvais m'empêcher d'essayer de savoir ce qui se passe dans le "Quoi?" version, veuillez jeter un oeil à jsbin.com/yewoyusevabe/1/edit?js console profiter 🙂
voici de très bonnes ressources que j'ai utilisé pour m'aider à savoir "quoi?" a été d'aller sur en.wikipedia.org/wiki/Latin_script_in_Unicode et developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/...
Très beau travail, merci à vous. Une question cependant: est-lettres.split("") est-il nécessaire? letters.charAt(i) et letters.length fonctionne très bien dans google Chrome (je n'ai pas testé d'autres navigateurs). Oh, et un petit conseil: c'est le seul endroit où vous utilisez des guillemets, il brise la cohérence d'avertissement dans mon JSHint. 🙂
Je suis un peu peu fou d'optimisation. chatAt peut être plus lent que d'accéder directement à un tableau. jsperf.com/charat-or-array. Mais vous avez raison dans les deux cas (y compris au sujet de la cohérence). Mais la réponse est un wiki de la communauté. Vous êtes libre de modifier.
Merci pour la réponse. Je suis pour l'optimisation, et oui, votre test prouve que la matrice de l'accès est plus rapide que charAt. Pourtant, le test lien ne parvient pas à prendre le coût de la split fonctionnement en compte. J'ai essayé de le faire apparaître dans une nouvelle version du test (jsperf.com/charat-or-array/2), et charAt dans ce cas est nettement plus rapide. Si mon test (et mon raisonnement) est correcte, cela vous donnera une chance pour split + accès au tableau de chaînes de caractères, qui dans la carte ne sont pas. Qu'en pensez-vous?
votre test est tout à fait correcte mais n'est pas "juste" dans certains cas (longues chaînes de caractères par exemple), car il nous faut diviser le tableau en une seule fois. Mais, oui, pour le petit texte, comme cette carte de fractionnement est trop cher. bonne prise.
Il semble plus naturel pour moi: vous divisez la chaîne, puis de parcourir le tableau à la fois. Je vois cela comme une partie de l'essai de performance. Pourtant, j'avoue que je ne suis pas familier avec jsperf et peut-être mal compris comment il calcule. Merci pour vos commentaires.
Je suis originaire de l'Autriche (de Langue allemande) et nous avons la lettre ß qui est usally sans ligatures "ss". Donc, je voudrais faire une autre ligne pour \u00DF comme { 'base': 'ss', 'lettres': '\u00DF' }. J'ai modifié le code pour mon Projet, mais je pense que c'est une préoccupation générale.
"Das est richtig" (c'est vrai). Mais, maintenant, j'ai réalisé qu'il y a un problème ici. ü en allemand devrait être de l'ue. En portugais, la même lettre u, car il n'y a pas de tréma dans cette langue. Trema était considéré seulement comme un accent. @CodingYourLife
Pensé que trop. Je pense que c'est pas vraiment un problème si Ü/Ä/Ö devenir u/a/o (peut-être controversée). Par exemple, le nom de famille Österreicher deviendra Osterreicher et c'est compréhensible. Le ß->s au lieu de ss est certainement un problème.
Considérant que '\u00DF'.toUpperCase() évalue à "SS", je pense que la conversion de \u00DF de ss est le droit de bouger. Le post étant un wiki de la communauté, peut-être @CodingYourLife de contribuer au changement que vous avez fait?
est 'defaultDiacriticsRemovalap" signifiait être "defaultDiacriticsRemovalMap'?
Est-ce juste moi ou toutes ces solutions sont vraiment compliqué pour aucune raison? J'ai posté une solution simple ci-dessous, quelqu'un d'autre le soin de voir si cela fonctionne pour leurs cas d'utilisation? Fonctionne très bien pour moi.
La définition de la " Chaîne de caractères.le prototype.normaliser " fait partie de ECMAScript 2015 (6e Édition, l'ECMA-262) la spécification. Ce problème a été demandé 13 Juin 2009.
J'ai fini par l'ajout de .replace(/[\u0301\u0060]/gi,'') à la fin pour supprimer l'espace vide avec des accents. Parfois dans Mac OS, è peut être e`
Je me demande si il y a une mise à jour sur cette, ou cette a été ajouté à une actuellement maintenu dépôt github, ou quelque chose de nous, nous pouvons suivre/ajouter à cela plutôt que sur stackoverflow wiki. J'étais sur le point de créer quelque chose, mais j'ai trouvé github.com/jprichardson/string.js qui semble inclure une latinise, c'est probablement pas la même mise en œuvre, mais semble un bon endroit pour commencer, toutes les autres recommandations. Ne nous créer une petite bibliothèque sortir de cette situation?
J'ai juste regardé le lié jsperf repères, tout le monde est ignorant le fait que sur la plupart des unités, la partie du code qui doit être perf avais est dans le "setup" de la boîte, à savoir en boucle sur la table de caractères pour construire l'objet nécessaire pour les remplacements. Ce n'est pas de code de configuration, il doit être copié dans chaque benchmark qui l'utilise, et c'est lent que diable.
je pense que la boucle que vous voyez là, c'est simplement la construction d'un "autre" de la matrice de la carte. Mais s'exécute une seule fois. Alors que vous accédez à ce tableau.
Quelques changements que je vous suggère: Ajouter: ʏ -> Ue, ð -> d, Changement: ä -> ae, ö -> oe, ü -> ue, Ä -> Ae, Ö -> Oe, Ü -> Ue, å -> aa, Å -> Aa, ß -> ss, ẞ -> SS,
Aussi ĳ -> ij et Ĳ -> IJ.
β est manquant, veuillez ajouter: en.wikipedia.org/wiki/Beta
Tapuscrit version: stackblitz.com/edit/...
pourquoi avez-vous effectuer une itération sur la carte pour effectuer une nouvelle carte?Je pense qu'il est plus judicieux de coder en dur la deuxième carte qui fait dans cette réponse: stackoverflow.com/a/53957849/4088205

InformationsquelleAutor

100

Une version plus complète avec la casse de soutien, des ligatures et autres joyeusetés.
Original source: http://lehelk.com/2011/05/06/script-to-remove-diacritics/

var defaultDiacriticsRemovalMap = [
{'base':'A', 'letters':/[\u0041\u24B6\uFF21\u00C0\u00C1\u00C2\u1EA6\u1EA4\u1EAA\u1EA8\u00C3\u0100\u0102\u1EB0\u1EAE\u1EB4\u1EB2\u0226\u01E0\u00C4\u01DE\u1EA2\u00C5\u01FA\u01CD\u0200\u0202\u1EA0\u1EAC\u1EB6\u1E00\u0104\u023A\u2C6F]/g},
{'base':'AA','letters':/[\uA732]/g},
{'base':'AE','letters':/[\u00C6\u01FC\u01E2]/g},
{'base':'AO','letters':/[\uA734]/g},
{'base':'AU','letters':/[\uA736]/g},
{'base':'AV','letters':/[\uA738\uA73A]/g},
{'base':'AY','letters':/[\uA73C]/g},
{'base':'B', 'letters':/[\u0042\u24B7\uFF22\u1E02\u1E04\u1E06\u0243\u0182\u0181]/g},
{'base':'C', 'letters':/[\u0043\u24B8\uFF23\u0106\u0108\u010A\u010C\u00C7\u1E08\u0187\u023B\uA73E]/g},
{'base':'D', 'letters':/[\u0044\u24B9\uFF24\u1E0A\u010E\u1E0C\u1E10\u1E12\u1E0E\u0110\u018B\u018A\u0189\uA779]/g},
{'base':'DZ','letters':/[\u01F1\u01C4]/g},
{'base':'Dz','letters':/[\u01F2\u01C5]/g},
{'base':'E', 'letters':/[\u0045\u24BA\uFF25\u00C8\u00C9\u00CA\u1EC0\u1EBE\u1EC4\u1EC2\u1EBC\u0112\u1E14\u1E16\u0114\u0116\u00CB\u1EBA\u011A\u0204\u0206\u1EB8\u1EC6\u0228\u1E1C\u0118\u1E18\u1E1A\u0190\u018E]/g},
{'base':'F', 'letters':/[\u0046\u24BB\uFF26\u1E1E\u0191\uA77B]/g},
{'base':'G', 'letters':/[\u0047\u24BC\uFF27\u01F4\u011C\u1E20\u011E\u0120\u01E6\u0122\u01E4\u0193\uA7A0\uA77D\uA77E]/g},
{'base':'H', 'letters':/[\u0048\u24BD\uFF28\u0124\u1E22\u1E26\u021E\u1E24\u1E28\u1E2A\u0126\u2C67\u2C75\uA78D]/g},
{'base':'I', 'letters':/[\u0049\u24BE\uFF29\u00CC\u00CD\u00CE\u0128\u012A\u012C\u0130\u00CF\u1E2E\u1EC8\u01CF\u0208\u020A\u1ECA\u012E\u1E2C\u0197]/g},
{'base':'J', 'letters':/[\u004A\u24BF\uFF2A\u0134\u0248]/g},
{'base':'K', 'letters':/[\u004B\u24C0\uFF2B\u1E30\u01E8\u1E32\u0136\u1E34\u0198\u2C69\uA740\uA742\uA744\uA7A2]/g},
{'base':'L', 'letters':/[\u004C\u24C1\uFF2C\u013F\u0139\u013D\u1E36\u1E38\u013B\u1E3C\u1E3A\u0141\u023D\u2C62\u2C60\uA748\uA746\uA780]/g},
{'base':'LJ','letters':/[\u01C7]/g},
{'base':'Lj','letters':/[\u01C8]/g},
{'base':'M', 'letters':/[\u004D\u24C2\uFF2D\u1E3E\u1E40\u1E42\u2C6E\u019C]/g},
{'base':'N', 'letters':/[\u004E\u24C3\uFF2E\u01F8\u0143\u00D1\u1E44\u0147\u1E46\u0145\u1E4A\u1E48\u0220\u019D\uA790\uA7A4]/g},
{'base':'NJ','letters':/[\u01CA]/g},
{'base':'Nj','letters':/[\u01CB]/g},
{'base':'O', 'letters':/[\u004F\u24C4\uFF2F\u00D2\u00D3\u00D4\u1ED2\u1ED0\u1ED6\u1ED4\u00D5\u1E4C\u022C\u1E4E\u014C\u1E50\u1E52\u014E\u022E\u0230\u00D6\u022A\u1ECE\u0150\u01D1\u020C\u020E\u01A0\u1EDC\u1EDA\u1EE0\u1EDE\u1EE2\u1ECC\u1ED8\u01EA\u01EC\u00D8\u01FE\u0186\u019F\uA74A\uA74C]/g},
{'base':'OI','letters':/[\u01A2]/g},
{'base':'OO','letters':/[\uA74E]/g},
{'base':'OU','letters':/[\u0222]/g},
{'base':'P', 'letters':/[\u0050\u24C5\uFF30\u1E54\u1E56\u01A4\u2C63\uA750\uA752\uA754]/g},
{'base':'Q', 'letters':/[\u0051\u24C6\uFF31\uA756\uA758\u024A]/g},
{'base':'R', 'letters':/[\u0052\u24C7\uFF32\u0154\u1E58\u0158\u0210\u0212\u1E5A\u1E5C\u0156\u1E5E\u024C\u2C64\uA75A\uA7A6\uA782]/g},
{'base':'S', 'letters':/[\u0053\u24C8\uFF33\u1E9E\u015A\u1E64\u015C\u1E60\u0160\u1E66\u1E62\u1E68\u0218\u015E\u2C7E\uA7A8\uA784]/g},
{'base':'T', 'letters':/[\u0054\u24C9\uFF34\u1E6A\u0164\u1E6C\u021A\u0162\u1E70\u1E6E\u0166\u01AC\u01AE\u023E\uA786]/g},
{'base':'TZ','letters':/[\uA728]/g},
{'base':'U', 'letters':/[\u0055\u24CA\uFF35\u00D9\u00DA\u00DB\u0168\u1E78\u016A\u1E7A\u016C\u00DC\u01DB\u01D7\u01D5\u01D9\u1EE6\u016E\u0170\u01D3\u0214\u0216\u01AF\u1EEA\u1EE8\u1EEE\u1EEC\u1EF0\u1EE4\u1E72\u0172\u1E76\u1E74\u0244]/g},
{'base':'V', 'letters':/[\u0056\u24CB\uFF36\u1E7C\u1E7E\u01B2\uA75E\u0245]/g},
{'base':'VY','letters':/[\uA760]/g},
{'base':'W', 'letters':/[\u0057\u24CC\uFF37\u1E80\u1E82\u0174\u1E86\u1E84\u1E88\u2C72]/g},
{'base':'X', 'letters':/[\u0058\u24CD\uFF38\u1E8A\u1E8C]/g},
{'base':'Y', 'letters':/[\u0059\u24CE\uFF39\u1EF2\u00DD\u0176\u1EF8\u0232\u1E8E\u0178\u1EF6\u1EF4\u01B3\u024E\u1EFE]/g},
{'base':'Z', 'letters':/[\u005A\u24CF\uFF3A\u0179\u1E90\u017B\u017D\u1E92\u1E94\u01B5\u0224\u2C7F\u2C6B\uA762]/g},
{'base':'a', 'letters':/[\u0061\u24D0\uFF41\u1E9A\u00E0\u00E1\u00E2\u1EA7\u1EA5\u1EAB\u1EA9\u00E3\u0101\u0103\u1EB1\u1EAF\u1EB5\u1EB3\u0227\u01E1\u00E4\u01DF\u1EA3\u00E5\u01FB\u01CE\u0201\u0203\u1EA1\u1EAD\u1EB7\u1E01\u0105\u2C65\u0250]/g},
{'base':'aa','letters':/[\uA733]/g},
{'base':'ae','letters':/[\u00E6\u01FD\u01E3]/g},
{'base':'ao','letters':/[\uA735]/g},
{'base':'au','letters':/[\uA737]/g},
{'base':'av','letters':/[\uA739\uA73B]/g},
{'base':'ay','letters':/[\uA73D]/g},
{'base':'b', 'letters':/[\u0062\u24D1\uFF42\u1E03\u1E05\u1E07\u0180\u0183\u0253]/g},
{'base':'c', 'letters':/[\u0063\u24D2\uFF43\u0107\u0109\u010B\u010D\u00E7\u1E09\u0188\u023C\uA73F\u2184]/g},
{'base':'d', 'letters':/[\u0064\u24D3\uFF44\u1E0B\u010F\u1E0D\u1E11\u1E13\u1E0F\u0111\u018C\u0256\u0257\uA77A]/g},
{'base':'dz','letters':/[\u01F3\u01C6]/g},
{'base':'e', 'letters':/[\u0065\u24D4\uFF45\u00E8\u00E9\u00EA\u1EC1\u1EBF\u1EC5\u1EC3\u1EBD\u0113\u1E15\u1E17\u0115\u0117\u00EB\u1EBB\u011B\u0205\u0207\u1EB9\u1EC7\u0229\u1E1D\u0119\u1E19\u1E1B\u0247\u025B\u01DD]/g},
{'base':'f', 'letters':/[\u0066\u24D5\uFF46\u1E1F\u0192\uA77C]/g},
{'base':'g', 'letters':/[\u0067\u24D6\uFF47\u01F5\u011D\u1E21\u011F\u0121\u01E7\u0123\u01E5\u0260\uA7A1\u1D79\uA77F]/g},
{'base':'h', 'letters':/[\u0068\u24D7\uFF48\u0125\u1E23\u1E27\u021F\u1E25\u1E29\u1E2B\u1E96\u0127\u2C68\u2C76\u0265]/g},
{'base':'hv','letters':/[\u0195]/g},
{'base':'i', 'letters':/[\u0069\u24D8\uFF49\u00EC\u00ED\u00EE\u0129\u012B\u012D\u00EF\u1E2F\u1EC9\u01D0\u0209\u020B\u1ECB\u012F\u1E2D\u0268\u0131]/g},
{'base':'j', 'letters':/[\u006A\u24D9\uFF4A\u0135\u01F0\u0249]/g},
{'base':'k', 'letters':/[\u006B\u24DA\uFF4B\u1E31\u01E9\u1E33\u0137\u1E35\u0199\u2C6A\uA741\uA743\uA745\uA7A3]/g},
{'base':'l', 'letters':/[\u006C\u24DB\uFF4C\u0140\u013A\u013E\u1E37\u1E39\u013C\u1E3D\u1E3B\u017F\u0142\u019A\u026B\u2C61\uA749\uA781\uA747]/g},
{'base':'lj','letters':/[\u01C9]/g},
{'base':'m', 'letters':/[\u006D\u24DC\uFF4D\u1E3F\u1E41\u1E43\u0271\u026F]/g},
{'base':'n', 'letters':/[\u006E\u24DD\uFF4E\u01F9\u0144\u00F1\u1E45\u0148\u1E47\u0146\u1E4B\u1E49\u019E\u0272\u0149\uA791\uA7A5]/g},
{'base':'nj','letters':/[\u01CC]/g},
{'base':'o', 'letters':/[\u006F\u24DE\uFF4F\u00F2\u00F3\u00F4\u1ED3\u1ED1\u1ED7\u1ED5\u00F5\u1E4D\u022D\u1E4F\u014D\u1E51\u1E53\u014F\u022F\u0231\u00F6\u022B\u1ECF\u0151\u01D2\u020D\u020F\u01A1\u1EDD\u1EDB\u1EE1\u1EDF\u1EE3\u1ECD\u1ED9\u01EB\u01ED\u00F8\u01FF\u0254\uA74B\uA74D\u0275]/g},
{'base':'oi','letters':/[\u01A3]/g},
{'base':'ou','letters':/[\u0223]/g},
{'base':'oo','letters':/[\uA74F]/g},
{'base':'p','letters':/[\u0070\u24DF\uFF50\u1E55\u1E57\u01A5\u1D7D\uA751\uA753\uA755]/g},
{'base':'q','letters':/[\u0071\u24E0\uFF51\u024B\uA757\uA759]/g},
{'base':'r','letters':/[\u0072\u24E1\uFF52\u0155\u1E59\u0159\u0211\u0213\u1E5B\u1E5D\u0157\u1E5F\u024D\u027D\uA75B\uA7A7\uA783]/g},
{'base':'s','letters':/[\u0073\u24E2\uFF53\u00DF\u015B\u1E65\u015D\u1E61\u0161\u1E67\u1E63\u1E69\u0219\u015F\u023F\uA7A9\uA785\u1E9B]/g},
{'base':'t','letters':/[\u0074\u24E3\uFF54\u1E6B\u1E97\u0165\u1E6D\u021B\u0163\u1E71\u1E6F\u0167\u01AD\u0288\u2C66\uA787]/g},
{'base':'tz','letters':/[\uA729]/g},
{'base':'u','letters':/[\u0075\u24E4\uFF55\u00F9\u00FA\u00FB\u0169\u1E79\u016B\u1E7B\u016D\u00FC\u01DC\u01D8\u01D6\u01DA\u1EE7\u016F\u0171\u01D4\u0215\u0217\u01B0\u1EEB\u1EE9\u1EEF\u1EED\u1EF1\u1EE5\u1E73\u0173\u1E77\u1E75\u0289]/g},
{'base':'v','letters':/[\u0076\u24E5\uFF56\u1E7D\u1E7F\u028B\uA75F\u028C]/g},
{'base':'vy','letters':/[\uA761]/g},
{'base':'w','letters':/[\u0077\u24E6\uFF57\u1E81\u1E83\u0175\u1E87\u1E85\u1E98\u1E89\u2C73]/g},
{'base':'x','letters':/[\u0078\u24E7\uFF58\u1E8B\u1E8D]/g},
{'base':'y','letters':/[\u0079\u24E8\uFF59\u1EF3\u00FD\u0177\u1EF9\u0233\u1E8F\u00FF\u1EF7\u1E99\u1EF5\u01B4\u024F\u1EFF]/g},
{'base':'z','letters':/[\u007A\u24E9\uFF5A\u017A\u1E91\u017C\u017E\u1E93\u1E95\u01B6\u0225\u0240\u2C6C\uA763]/g}
];
var changes;
function removeDiacritics (str) {
if(!changes) {
changes = defaultDiacriticsRemovalMap;
}
for(var i=0; i<changes.length; i++) {
str = str.replace(changes[i].letters, changes[i].base);
}
return str;
}

Quelqu'un peut-il m'expliquer pourquoi il y a un "modifications", var-là. Ne pourrions-nous pas simplement utiliser directement l'diacriticsMap?
Oui, vous pouvez. Cependant, cela vous permet de substituer à l'autre, les signes diacritiques de la carte par la mise en valeur de changes à elle.
De faire au moins un paramètre facultatif de removeDiacritics, alors. Jeez, vraiment? Une variable externe? Pourquoi?
œ ({ base: "oe", letters: /[\u0153]/g }) et Œ ({ base: "OE", letters: /[\u0152]/g }) sont manquantes. Il existe peut-être plus, mais depuis l'OP mentionné ci, je pense qu'ils devraient être ajoutés.
Quelques changements, j'ai proposé à la version modifiée, l'ajouter ici: Manquant: ʏ -> Ue, ð -> d, Changement: ä -> ae, ö -> oe, ü -> ue, Ä -> Ae, Ö -> Oe, Ü -> Ue, å -> aa, Å -> Aa, ß -> ss, ẞ -> SS,
Aussi ĳ -> ij et Ĳ -> IJ.

InformationsquelleAutor khel

Le format de new RegExp est

RegExp(something, 'modifiers');

Si vous voulez

accentsTidy = function(s){
var r=s.toLowerCase();
r = r.replace(new RegExp("\\s", 'g'),"");
r = r.replace(new RegExp("[àáâãäå]", 'g'),"a");
r = r.replace(new RegExp("æ", 'g'),"ae");
r = r.replace(new RegExp("ç", 'g'),"c");
r = r.replace(new RegExp("[èéêë]", 'g'),"e");
r = r.replace(new RegExp("[ìíîï]", 'g'),"i");
r = r.replace(new RegExp("ñ", 'g'),"n");                            
r = r.replace(new RegExp("[òóôõö]", 'g'),"o");
r = r.replace(new RegExp("œ", 'g'),"oe");
r = r.replace(new RegExp("[ùúûü]", 'g'),"u");
r = r.replace(new RegExp("[ýÿ]", 'g'),"y");
r = r.replace(new RegExp("\\W", 'g'),"");
return r;
};

+1 pour Ian. @subtenante voir: developer.mozilla.org/en/Core_JavaScript_1.5_Reference/...
Ne pouvais pas obtenir ce code. Assurez-vous que la doc de l'encodage UTF8!
Excellente solution, juste une petite remarque: l'ajout de ces deux caractères à leurs positions appropriées: ő, ű
Excellente solution! On peut raccourcir encore plus loin en encapsulant tous les non ascii rrpc dans un tableau associatif et d'itération sur elle. Je vais la poster comme une alternative de réponse ci-dessous, car les commentaires ne fonctionnent pas pour elle. Merci!

InformationsquelleAutor Ian Elliott

14

Raccourcie de code basé sur l'excellente solution par Ian Elliott:
```
accentsTidy = function(s){
var r = s.toLowerCase();
non_asciis = {'a': '[àáâãäå]', 'ae': 'æ', 'c': 'ç', 'e': '[èéêë]', 'i': '[ìíîï]', 'n': 'ñ', 'o': '[òóôõö]', 'oe': 'œ', 'u': '[ùúûűü]', 'y': '[ýÿ]'};
for (i in non_asciis) { r = r.replace(new RegExp(non_asciis[i], 'g'), i); }
return r;
};
```
Edit: correction de la non-code de travail
- Malheureusement, ce code est TRÈS lent. Je l'ai testé avec une grande liste non ordonnée et la performance succès est grand, comparé à d'autres méthodes expliquées dans cette page (j'ai fini à l'aide de la accepté de répondre). BTW, j'ai corrigé un bug dans votre code. Vous avez eu un appel pour un non-existant variable "url" à la quatrième ligne.
InformationsquelleAutor Simon Steinberger
14

Vous pouvez utiliser le _.ébavurer méthode de la Lodash bibliothèque.

Il est disponible comme un stand-alone MNP paquet lodash.ébavurer, ou dans le cadre de la lodash paquet.
```
let myStringWithAccent = 'Mon café est plein de caféïne';
let myStringWithoutAccent = deburr(myStringWithAccent);
```
Le résultat sera : "Mon cafe est plein de cafeine"

InformationsquelleAutor colin
7

Une solution qui me semble être la manière la plus rapide par la donnée de test : http://jsperf.com/diacritics/9
```
function removeDiacritics(str) {
return str.replace(/[^A-Za-z0-9\s]+/g, function(a){
return diacriticsMap[a] || a; 
});
}
removeDiacritics(teste);
```
De travail exemple: http://jsbin.com/sovorute/1/edit

Raisonnement: l'Une des raisons c'est beaucoup plus rapide est parce que nous ne itérer sur les caractères spéciaux, choisis par le nié regex modèle. Le plus rapide des essais (Chaîne d'Itération sans) itère 1001 sur le texte donné, ce qui signifie chaque personnage. Ce on itère seulement 35 fois et les sorties de l' même résultat. Gardez à l'esprit que cela ne fera que remplacer ce qui est indiqué dans la carte.

Classique article sur le sujet: http://alistapart.com/article/accent-folding-for-auto-complete

De crédit: http://semplicewebsites.com/removing-accents-javascript , fournit également une belle carte des caractères.
- euh, si ce + être là-bas?
InformationsquelleAutor gabssnake

Un moyen plus simple de remplacer la diacriticals.

function replaceDiacritics(str){
var diacritics = [
{char: 'A', base: /[\300-\306]/g},
{char: 'a', base: /[\340-\346]/g},
{char: 'E', base: /[\310-\313]/g},
{char: 'e', base: /[\350-\353]/g},
{char: 'I', base: /[\314-\317]/g},
{char: 'i', base: /[\354-\357]/g},
{char: 'O', base: /[\322-\330]/g},
{char: 'o', base: /[\362-\370]/g},
{char: 'U', base: /[\331-\334]/g},
{char: 'u', base: /[\371-\374]/g},
{char: 'N', base: /[\321]/g},
{char: 'n', base: /[\361]/g},
{char: 'C', base: /[\307]/g},
{char: 'c', base: /[\347]/g}
]
diacritics.forEach(function(letter){
str = str.replace(letter.base, letter.char);
});
return str;
};

InformationsquelleAutor Javi Alcantara

6

Dans MNP il y a un paquet pour cette: latinize

C'est un très bon package pour résoudre ce problème.
- La façon la plus propre de le faire. Merci!!!!
InformationsquelleAutor slorenzo

J'ai fourche billyle code de
http://jsfiddle.net/billybraga/UHmnf/ (à partir de son post) dans cette: http://jsfiddle.net/infralabs/dJX58/

J'ai corrigé la transcription de ſ et ß caractères, et a également ajouté coversion de ceux-ci: Þþ, Ðð, Ŋŋ, Ĳĳ, Œ.

La modification de l'extrait de code ci-dessous:

var defaultDiacriticsRemovalMap = [{
'base': "A",
'letters': /(&#65;|&#9398;|&#65313;|&#192;|&#193;|&#194;|&#7846;|&#7844;|&#7850;|&#7848;|&#195;|&#256;|&#258;|&#7856;|&#7854;|&#7860;|&#7858;|&#550;|&#480;|&#196;|&#478;|&#7842;|&#197;|&#506;|&#461;|&#512;|&#514;|&#7840;|&#7852;|&#7862;|&#7680;|&#260;|&#570;|&#11375;|[\u0041\u24B6\uFF21\u00C0\u00C1\u00C2\u1EA6\u1EA4\u1EAA\u1EA8\u00C3\u0100\u0102\u1EB0\u1EAE\u1EB4\u1EB2\u0226\u01E0\u00C4\u01DE\u1EA2\u00C5\u01FA\u01CD\u0200\u0202\u1EA0\u1EAC\u1EB6\u1E00\u0104\u023A\u2C6F])/g
}, {
'base': "AA",
'letters': /(&#42802;|[\uA732])/g
}, {
'base': "AE",
'letters': /(&#198;|&#508;|&#482;|[\u00C6\u01FC\u01E2])/g
}, {
'base': "AO",
'letters': /(&#42804;|[\uA734])/g
}, {
'base': "AU",
'letters': /(&#42806;|[\uA736])/g
}, {
'base': "AV",
'letters': /(&#42808;|&#42810;|[\uA738\uA73A])/g
}, {
'base': "AY",
'letters': /(&#42812;|[\uA73C])/g
}, {
'base': "B",
'letters': /(&#66;|&#9399;|&#65314;|&#7682;|&#7684;|&#7686;|&#579;|&#386;|&#385;|[\u0042\u24B7\uFF22\u1E02\u1E04\u1E06\u0243\u0182\u0181])/g
}, {
'base': "C",
'letters': /(&#67;|&#9400;|&#65315;|&#262;|&#264;|&#266;|&#268;|&#199;|&#7688;|&#391;|&#571;|&#42814;|[\u0043\u24B8\uFF23\u0106\u0108\u010A\u010C\u00C7\u1E08\u0187\u023B\uA73E])/g
}, {
'base': "D",
'letters': /(&#68;|&#9401;|&#65316;|&#7690;|&#270;|&#7692;|&#7696;|&#7698;|&#7694;|&#272;|&#395;|&#394;|&#393;|&#42873;|&#208;|[\u0044\u24B9\uFF24\u1E0A\u010E\u1E0C\u1E10\u1E12\u1E0E\u0110\u018B\u018A\u0189\uA779\u00D0])/g
}, {
'base': "DZ",
'letters': /(&#497;|&#452;|[\u01F1\u01C4])/g
}, {
'base': "Dz",
'letters': /(&#498;|&#453;|[\u01F2\u01C5])/g
}, {
'base': "E",
'letters': /(&#69;|&#9402;|&#65317;|&#200;|&#201;|&#202;|&#7872;|&#7870;|&#7876;|&#7874;|&#7868;|&#274;|&#7700;|&#7702;|&#276;|&#278;|&#203;|&#7866;|&#282;|&#516;|&#518;|&#7864;|&#7878;|&#552;|&#7708;|&#280;|&#7704;|&#7706;|&#400;|&#398;|[\u0045\u24BA\uFF25\u00C8\u00C9\u00CA\u1EC0\u1EBE\u1EC4\u1EC2\u1EBC\u0112\u1E14\u1E16\u0114\u0116\u00CB\u1EBA\u011A\u0204\u0206\u1EB8\u1EC6\u0228\u1E1C\u0118\u1E18\u1E1A\u0190\u018E])/g
}, {
'base': "F",
'letters': /(&#70;|&#9403;|&#65318;|&#7710;|&#401;|&#42875;|[\u0046\u24BB\uFF26\u1E1E\u0191\uA77B])/g
}, {
'base': "G",
'letters': /(&#71;|&#9404;|&#65319;|&#500;|&#284;|&#7712;|&#286;|&#288;|&#486;|&#290;|&#484;|&#403;|&#42912;|&#42877;|&#42878;|[\u0047\u24BC\uFF27\u01F4\u011C\u1E20\u011E\u0120\u01E6\u0122\u01E4\u0193\uA7A0\uA77D\uA77E])/g
}, {
'base': "H",
'letters': /(&#72;|&#9405;|&#65320;|&#292;|&#7714;|&#7718;|&#542;|&#7716;|&#7720;|&#7722;|&#294;|&#11367;|&#11381;|&#42893;|[\u0048\u24BD\uFF28\u0124\u1E22\u1E26\u021E\u1E24\u1E28\u1E2A\u0126\u2C67\u2C75\uA78D])/g
}, {
'base': "I",
'letters': /(&#73;|&#9406;|&#65321;|&#204;|&#205;|&#206;|&#296;|&#298;|&#300;|&#304;|&#207;|&#7726;|&#7880;|&#463;|&#520;|&#522;|&#7882;|&#302;|&#7724;|&#407;|[\u0049\u24BE\uFF29\u00CC\u00CD\u00CE\u0128\u012A\u012C\u0130\u00CF\u1E2E\u1EC8\u01CF\u0208\u020A\u1ECA\u012E\u1E2C\u0197])/g
}, {
'base': "J",
'letters': /(&#74;|&#9407;|&#65322;|&#308;|&#584;|[\u004A\u24BF\uFF2A\u0134\u0248])/g
}, {
'base': "K",
'letters': /(&#75;|&#9408;|&#65323;|&#7728;|&#488;|&#7730;|&#310;|&#7732;|&#408;|&#11369;|&#42816;|&#42818;|&#42820;|&#42914;|[\u004B\u24C0\uFF2B\u1E30\u01E8\u1E32\u0136\u1E34\u0198\u2C69\uA740\uA742\uA744\uA7A2])/g
}, {
'base': "L",
'letters': /(&#76;|&#9409;|&#65324;|&#319;|&#313;|&#317;|&#7734;|&#7736;|&#315;|&#7740;|&#7738;|&#321;|&#573;|&#11362;|&#11360;|&#42824;|&#42822;|&#42880;|[\u004C\u24C1\uFF2C\u013F\u0139\u013D\u1E36\u1E38\u013B\u1E3C\u1E3A\u0141\u023D\u2C62\u2C60\uA748\uA746\uA780])/g
}, {
'base': "LJ",
'letters': /(&#455;|[\u01C7])/g
}, {
'base': "Lj",
'letters': /(&#456;|[\u01C8])/g
}, {
'base': "M",
'letters': /(&#77;|&#9410;|&#65325;|&#7742;|&#7744;|&#7746;|&#11374;|&#412;|[\u004D\u24C2\uFF2D\u1E3E\u1E40\u1E42\u2C6E\u019C])/g
}, {
'base': "N",
'letters': /(&#78;|&#9411;|&#65326;|&#504;|&#323;|&#209;|&#7748;|&#327;|&#7750;|&#325;|&#7754;|&#7752;|&#544;|&#413;|&#42896;|&#42916;|&#330;|[\u004E\u24C3\uFF2E\u01F8\u0143\u00D1\u1E44\u0147\u1E46\u0145\u1E4A\u1E48\u0220\u019D\uA790\uA7A4\u014A])/g
}, {
'base': "NJ",
'letters': /(&#458;|[\u01CA])/g
}, {
'base': "Nj",
'letters': /(&#459;|[\u01CB])/g
}, {
'base': "O",
'letters': /(&#79;|&#9412;|&#65327;|&#210;|&#211;|&#212;|&#7890;|&#7888;|&#7894;|&#7892;|&#213;|&#7756;|&#556;|&#7758;|&#332;|&#7760;|&#7762;|&#334;|&#558;|&#560;|&#214;|&#554;|&#7886;|&#336;|&#465;|&#524;|&#526;|&#416;|&#7900;|&#7898;|&#7904;|&#7902;|&#7906;|&#7884;|&#7896;|&#490;|&#492;|&#216;|&#510;|&#390;|&#415;|&#42826;|&#42828;|[\u004F\u24C4\uFF2F\u00D2\u00D3\u00D4\u1ED2\u1ED0\u1ED6\u1ED4\u00D5\u1E4C\u022C\u1E4E\u014C\u1E50\u1E52\u014E\u022E\u0230\u00D6\u022A\u1ECE\u0150\u01D1\u020C\u020E\u01A0\u1EDC\u1EDA\u1EE0\u1EDE\u1EE2\u1ECC\u1ED8\u01EA\u01EC\u00D8\u01FE\u0186\u019F\uA74A\uA74C])/g
}, {
'base': "OE",
'letters': /(&#338;|[\u0152])/g
}, {
'base': "OI",
'letters': /(&#418;|[\u01A2])/g
}, {
'base': "OO",
'letters': /(&#42830;|[\uA74E])/g
}, {
'base': "OU",
'letters': /(&#546;|[\u0222])/g
}, {
'base': "P",
'letters': /(&#80;|&#9413;|&#65328;|&#7764;|&#7766;|&#420;|&#11363;|&#42832;|&#42834;|&#42836;|[\u0050\u24C5\uFF30\u1E54\u1E56\u01A4\u2C63\uA750\uA752\uA754])/g
}, {
'base': "Q",
'letters': /(&#81;|&#9414;|&#65329;|&#42838;|&#42840;|&#586;|[\u0051\u24C6\uFF31\uA756\uA758\u024A])/g
}, {
'base': "R",
'letters': /(&#82;|&#9415;|&#65330;|&#340;|&#7768;|&#344;|&#528;|&#530;|&#7770;|&#7772;|&#342;|&#7774;|&#588;|&#11364;|&#42842;|&#42918;|&#42882;|[\u0052\u24C7\uFF32\u0154\u1E58\u0158\u0210\u0212\u1E5A\u1E5C\u0156\u1E5E\u024C\u2C64\uA75A\uA7A6\uA782])/g
}, {
'base': "S",
'letters': /(&#83;|&#9416;|&#65331;|&#7838;|&#346;|&#7780;|&#348;|&#7776;|&#352;|&#7782;|&#7778;|&#7784;|&#536;|&#350;|&#11390;|&#42920;|&#42884;|[\u0053\u24C8\uFF33\u1E9E\u015A\u1E64\u015C\u1E60\u0160\u1E66\u1E62\u1E68\u0218\u015E\u2C7E\uA7A8\uA784])/g
}, {
'base': "T",
'letters': /(&#84;|&#9417;|&#65332;|&#7786;|&#356;|&#7788;|&#538;|&#354;|&#7792;|&#7790;|&#358;|&#428;|&#430;|&#574;|&#42886;|[\u0054\u24C9\uFF34\u1E6A\u0164\u1E6C\u021A\u0162\u1E70\u1E6E\u0166\u01AC\u01AE\u023E\uA786])/g
}, {
'base': "TH",
'letters': /(&#222;|[\u00DE])/g
}, {
'base': "TZ",
'letters': /(&#42792;|[\uA728])/g
}, {
'base': "U",
'letters': /(&#85;|&#9418;|&#65333;|&#217;|&#218;|&#219;|&#360;|&#7800;|&#362;|&#7802;|&#364;|&#220;|&#475;|&#471;|&#469;|&#473;|&#7910;|&#366;|&#368;|&#467;|&#532;|&#534;|&#431;|&#7914;|&#7912;|&#7918;|&#7916;|&#7920;|&#7908;|&#7794;|&#370;|&#7798;|&#7796;|&#580;|[\u0055\u24CA\uFF35\u00D9\u00DA\u00DB\u0168\u1E78\u016A\u1E7A\u016C\u00DC\u01DB\u01D7\u01D5\u01D9\u1EE6\u016E\u0170\u01D3\u0214\u0216\u01AF\u1EEA\u1EE8\u1EEE\u1EEC\u1EF0\u1EE4\u1E72\u0172\u1E76\u1E74\u0244])/g
}, {
'base': "V",
'letters': /(&#86;|&#9419;|&#65334;|&#7804;|&#7806;|&#434;|&#42846;|&#581;|[\u0056\u24CB\uFF36\u1E7C\u1E7E\u01B2\uA75E\u0245])/g
}, {
'base': "VY",
'letters': /(&#42848;|[\uA760])/g
}, {
'base': "W",
'letters': /(&#87;|&#9420;|&#65335;|&#7808;|&#7810;|&#372;|&#7814;|&#7812;|&#7816;|&#11378;|[\u0057\u24CC\uFF37\u1E80\u1E82\u0174\u1E86\u1E84\u1E88\u2C72])/g
}, {
'base': "X",
'letters': /(&#88;|&#9421;|&#65336;|&#7818;|&#7820;|[\u0058\u24CD\uFF38\u1E8A\u1E8C])/g
}, {
'base': "Y",
'letters': /(&#89;|&#9422;|&#65337;|&#7922;|&#221;|&#374;|&#7928;|&#562;|&#7822;|&#376;|&#7926;|&#7924;|&#435;|&#590;|&#7934;|[\u0059\u24CE\uFF39\u1EF2\u00DD\u0176\u1EF8\u0232\u1E8E\u0178\u1EF6\u1EF4\u01B3\u024E\u1EFE])/g
}, {
'base': "Z",
'letters': /(&#90;|&#9423;|&#65338;|&#377;|&#7824;|&#379;|&#381;|&#7826;|&#7828;|&#437;|&#548;|&#11391;|&#11371;|&#42850;|[\u005A\u24CF\uFF3A\u0179\u1E90\u017B\u017D\u1E92\u1E94\u01B5\u0224\u2C7F\u2C6B\uA762])/g
}, {
'base': "a",
'letters': /(&#97;|&#9424;|&#65345;|&#7834;|&#224;|&#225;|&#226;|&#7847;|&#7845;|&#7851;|&#7849;|&#227;|&#257;|&#259;|&#7857;|&#7855;|&#7861;|&#7859;|&#551;|&#481;|&#228;|&#479;|&#7843;|&#229;|&#507;|&#462;|&#513;|&#515;|&#7841;|&#7853;|&#7863;|&#7681;|&#261;|&#11365;|&#592;|[\u0061\u24D0\uFF41\u1E9A\u00E0\u00E1\u00E2\u1EA7\u1EA5\u1EAB\u1EA9\u00E3\u0101\u0103\u1EB1\u1EAF\u1EB5\u1EB3\u0227\u01E1\u00E4\u01DF\u1EA3\u00E5\u01FB\u01CE\u0201\u0203\u1EA1\u1EAD\u1EB7\u1E01\u0105\u2C65\u0250])/g
}, {
'base': "aa",
'letters': /(&#42803;|[\uA733])/g
}, {
'base': "ae",
'letters': /(&#230;|&#509;|&#483;|[\u00E6\u01FD\u01E3])/g
}, {
'base': "ao",
'letters': /(&#42805;|[\uA735])/g
}, {
'base': "au",
'letters': /(&#42807;|[\uA737])/g
}, {
'base': "av",
'letters': /(&#42809;|&#42811;|[\uA739\uA73B])/g
}, {
'base': "ay",
'letters': /(&#42813;|[\uA73D])/g
}, {
'base': "b",
'letters': /(&#98;|&#9425;|&#65346;|&#7683;|&#7685;|&#7687;|&#384;|&#387;|&#595;|[\u0062\u24D1\uFF42\u1E03\u1E05\u1E07\u0180\u0183\u0253])/g
}, {
'base': "c",
'letters': /(&#99;|&#9426;|&#65347;|&#263;|&#265;|&#267;|&#269;|&#231;|&#7689;|&#392;|&#572;|&#42815;|&#8580;|[\u0063\u24D2\uFF43\u0107\u0109\u010B\u010D\u00E7\u1E09\u0188\u023C\uA73F\u2184])/g
}, {
'base': "d",
'letters': /(&#100;|&#9427;|&#65348;|&#7691;|&#271;|&#7693;|&#7697;|&#7699;|&#7695;|&#273;|&#396;|&#598;|&#599;|&#42874;|&#240;|[\u0064\u24D3\uFF44\u1E0B\u010F\u1E0D\u1E11\u1E13\u1E0F\u0111\u018C\u0256\u0257\uA77A\u00F0])/g
}, {
'base': "dz",
'letters': /(&#499;|&#454;|[\u01F3\u01C6])/g
}, {
'base': "e",
'letters': /(&#101;|&#9428;|&#65349;|&#232;|&#233;|&#234;|&#7873;|&#7871;|&#7877;|&#7875;|&#7869;|&#275;|&#7701;|&#7703;|&#277;|&#279;|&#235;|&#7867;|&#283;|&#517;|&#519;|&#7865;|&#7879;|&#553;|&#7709;|&#281;|&#7705;|&#7707;|&#583;|&#603;|&#477;|[\u0065\u24D4\uFF45\u00E8\u00E9\u00EA\u1EC1\u1EBF\u1EC5\u1EC3\u1EBD\u0113\u1E15\u1E17\u0115\u0117\u00EB\u1EBB\u011B\u0205\u0207\u1EB9\u1EC7\u0229\u1E1D\u0119\u1E19\u1E1B\u0247\u025B\u01DD])/g
}, {
'base': "f",
'letters': /(&#102;|&#9429;|&#65350;|&#7711;|&#402;|&#42876;|[\u0066\u24D5\uFF46\u1E1F\u0192\uA77C])/g
}, {
'base': "g",
'letters': /(&#103;|&#9430;|&#65351;|&#501;|&#285;|&#7713;|&#287;|&#289;|&#487;|&#291;|&#485;|&#608;|&#42913;|&#7545;|&#42879;|[\u0067\u24D6\uFF47\u01F5\u011D\u1E21\u011F\u0121\u01E7\u0123\u01E5\u0260\uA7A1\u1D79\uA77F])/g
}, {
'base': "h",
'letters': /(&#104;|&#9431;|&#65352;|&#293;|&#7715;|&#7719;|&#543;|&#7717;|&#7721;|&#7723;|&#7830;|&#295;|&#11368;|&#11382;|&#613;|[\u0068\u24D7\uFF48\u0125\u1E23\u1E27\u021F\u1E25\u1E29\u1E2B\u1E96\u0127\u2C68\u2C76\u0265])/g
}, {
'base': "hv",
'letters': /(&#405;|[\u0195])/g
}, {
'base': "i",
'letters': /(&#105;|&#9432;|&#65353;|&#236;|&#237;|&#238;|&#297;|&#299;|&#301;|&#239;|&#7727;|&#7881;|&#464;|&#521;|&#523;|&#7883;|&#303;|&#7725;|&#616;|&#305;|[\u0069\u24D8\uFF49\u00EC\u00ED\u00EE\u0129\u012B\u012D\u00EF\u1E2F\u1EC9\u01D0\u0209\u020B\u1ECB\u012F\u1E2D\u0268\u0131])/g
}, {
'base': "ij",
'letters': /(&#307;|[\u0133])/g
}, {
'base': "j",
'letters': /(&#106;|&#9433;|&#65354;|&#309;|&#496;|&#585;|[\u006A\u24D9\uFF4A\u0135\u01F0\u0249])/g
}, {
'base': "k",
'letters': /(&#107;|&#9434;|&#65355;|&#7729;|&#489;|&#7731;|&#311;|&#7733;|&#409;|&#11370;|&#42817;|&#42819;|&#42821;|&#42915;|[\u006B\u24DA\uFF4B\u1E31\u01E9\u1E33\u0137\u1E35\u0199\u2C6A\uA741\uA743\uA745\uA7A3])/g
}, {
'base': "l",
'letters': /(&#108;|&#9435;|&#65356;|&#320;|&#314;|&#318;|&#7735;|&#7737;|&#316;|&#7741;|&#7739;|&#322;|&#410;|&#619;|&#11361;|&#42825;|&#42881;|&#42823;|[\u006C\u24DB\uFF4C\u0140\u013A\u013E\u1E37\u1E39\u013C\u1E3D\u1E3B\u0142\u019A\u026B\u2C61\uA749\uA781\uA747])/g
}, {
'base': "lj",
'letters': /(&#457;|[\u01C9])/g
}, {
'base': "m",
'letters': /(&#109;|&#9436;|&#65357;|&#7743;|&#7745;|&#7747;|&#625;|&#623;|[\u006D\u24DC\uFF4D\u1E3F\u1E41\u1E43\u0271\u026F])/g
}, {
'base': "n",
'letters': /(&#110;|&#9437;|&#65358;|&#505;|&#324;|&#241;|&#7749;|&#328;|&#7751;|&#326;|&#7755;|&#7753;|&#414;|&#626;|&#329;|&#42897;|&#42917;|&#331;|[\u006E\u24DD\uFF4E\u01F9\u0144\u00F1\u1E45\u0148\u1E47\u0146\u1E4B\u1E49\u019E\u0272\u0149\uA791\uA7A5\u014B])/g
}, {
'base': "nj",
'letters': /(&#460;|[\u01CC])/g
}, {
'base': "o",
'letters': /(&#111;|&#9438;|&#65359;|&#242;|&#243;|&#244;|&#7891;|&#7889;|&#7895;|&#7893;|&#245;|&#7757;|&#557;|&#7759;|&#333;|&#7761;|&#7763;|&#335;|&#559;|&#561;|&#246;|&#555;|&#7887;|&#337;|&#466;|&#525;|&#527;|&#417;|&#7901;|&#7899;|&#7905;|&#7903;|&#7907;|&#7885;|&#7897;|&#491;|&#493;|&#248;|&#511;|&#596;|&#42827;|&#42829;|&#629;|[\u006F\u24DE\uFF4F\u00F2\u00F3\u00F4\u1ED3\u1ED1\u1ED7\u1ED5\u00F5\u1E4D\u022D\u1E4F\u014D\u1E51\u1E53\u014F\u022F\u0231\u00F6\u022B\u1ECF\u0151\u01D2\u020D\u020F\u01A1\u1EDD\u1EDB\u1EE1\u1EDF\u1EE3\u1ECD\u1ED9\u01EB\u01ED\u00F8\u01FF\u0254\uA74B\uA74D\u0275])/g
}, {
'base': "oe",
'letters': /(&#339;|[\u0153])/g
}, {
'base': "oi",
'letters': /(&#419;|[\u01A3])/g
}, {
'base': "ou",
'letters': /(&#547;|[\u0223])/g
}, {
'base': "oo",
'letters': /(&#42831;|[\uA74F])/g
}, {
'base': "p",
'letters': /(&#112;|&#9439;|&#65360;|&#7765;|&#7767;|&#421;|&#7549;|&#42833;|&#42835;|&#42837;|[\u0070\u24DF\uFF50\u1E55\u1E57\u01A5\u1D7D\uA751\uA753\uA755])/g
}, {
'base': "q",
'letters': /(&#113;|&#9440;|&#65361;|&#587;|&#42839;|&#42841;|[\u0071\u24E0\uFF51\u024B\uA757\uA759])/g
}, {
'base': "r",
'letters': /(&#114;|&#9441;|&#65362;|&#341;|&#7769;|&#345;|&#529;|&#531;|&#7771;|&#7773;|&#343;|&#7775;|&#589;|&#637;|&#42843;|&#42919;|&#42883;|[\u0072\u24E1\uFF52\u0155\u1E59\u0159\u0211\u0213\u1E5B\u1E5D\u0157\u1E5F\u024D\u027D\uA75B\uA7A7\uA783])/g
}, {
'base': "s",
'letters': /(&#115;|&#9442;|&#65363;|&#347;|&#7781;|&#349;|&#7777;|&#353;|&#7783;|&#7779;|&#7785;|&#537;|&#351;|&#575;|&#42921;|&#42885;|&#7835;|&#383;|[\u0073\u24E2\uFF53\u015B\u1E65\u015D\u1E61\u0161\u1E67\u1E63\u1E69\u0219\u015F\u023F\uA7A9\uA785\u1E9B\u017F])/g
}, {
'base': "ss",
'letters': /(&#223;|[\u00DF])/g
}, {
'base': "t",
'letters': /(&#116;|&#9443;|&#65364;|&#7787;|&#7831;|&#357;|&#7789;|&#539;|&#355;|&#7793;|&#7791;|&#359;|&#429;|&#648;|&#11366;|&#42887;|[\u0074\u24E3\uFF54\u1E6B\u1E97\u0165\u1E6D\u021B\u0163\u1E71\u1E6F\u0167\u01AD\u0288\u2C66\uA787])/g
}, {
'base': "th",
'letters': /(&#254;|[\u00FE])/g
}, {
'base': "tz",
'letters': /(&#42793;|[\uA729])/g
}, {
'base': "u",
'letters': /(&#117;|&#9444;|&#65365;|&#249;|&#250;|&#251;|&#361;|&#7801;|&#363;|&#7803;|&#365;|&#252;|&#476;|&#472;|&#470;|&#474;|&#7911;|&#367;|&#369;|&#468;|&#533;|&#535;|&#432;|&#7915;|&#7913;|&#7919;|&#7917;|&#7921;|&#7909;|&#7795;|&#371;|&#7799;|&#7797;|&#649;|[\u0075\u24E4\uFF55\u00F9\u00FA\u00FB\u0169\u1E79\u016B\u1E7B\u016D\u00FC\u01DC\u01D8\u01D6\u01DA\u1EE7\u016F\u0171\u01D4\u0215\u0217\u01B0\u1EEB\u1EE9\u1EEF\u1EED\u1EF1\u1EE5\u1E73\u0173\u1E77\u1E75\u0289])/g
}, {
'base': "v",
'letters': /(&#118;|&#9445;|&#65366;|&#7805;|&#7807;|&#651;|&#42847;|&#652;|[\u0076\u24E5\uFF56\u1E7D\u1E7F\u028B\uA75F\u028C])/g
}, {
'base': "vy",
'letters': /(&#42849;|[\uA761])/g
}, {
'base': "w",
'letters': /(&#119;|&#9446;|&#65367;|&#7809;|&#7811;|&#373;|&#7815;|&#7813;|&#7832;|&#7817;|&#11379;|[\u0077\u24E6\uFF57\u1E81\u1E83\u0175\u1E87\u1E85\u1E98\u1E89\u2C73])/g
}, {
'base': "x",
'letters': /(&#120;|&#9447;|&#65368;|&#7819;|&#7821;|[\u0078\u24E7\uFF58\u1E8B\u1E8D])/g
}, {
'base': "y",
'letters': /(&#121;|&#9448;|&#65369;|&#7923;|&#253;|&#375;|&#7929;|&#563;|&#7823;|&#255;|&#7927;|&#7833;|&#7925;|&#436;|&#591;|&#7935;|[\u0079\u24E8\uFF59\u1EF3\u00FD\u0177\u1EF9\u0233\u1E8F\u00FF\u1EF7\u1E99\u1EF5\u01B4\u024F\u1EFF])/g
}, {
'base': "z",
'letters': /(&#122;|&#9449;|&#65370;|&#378;|&#7825;|&#380;|&#382;|&#7827;|&#7829;|&#438;|&#549;|&#576;|&#11372;|&#42851;|[\u007A\u24E9\uFF5A\u017A\u1E91\u017C\u017E\u1E93\u1E95\u01B6\u0225\u0240\u2C6C\uA763])/g
}];

et la version AS3 ici: github.com/infralabs/DiacriticsRemove
et la version de PHP ici: github.com/infralabs/DiacriticsRemovePHP

InformationsquelleAutor infralabs

Il y en a beaucoup là-bas, mais je pense que celui-ci est simple et assez bon:

 function remove_accents(strAccents) {
var strAccents = strAccents.split('');
var strAccentsOut = new Array();
var strAccentsLen = strAccents.length;
var accents =    "ÀÁÂÃÄÅàáâãäåÒÓÔÕÕÖØòóôõöøÈÉÊËèéêëðÇçÐÌÍÎÏìíîïÙÚÛÜùúûüÑñŠšŸÿýŽž";
var accentsOut = "AAAAAAaaaaaaOOOOOOOooooooEEEEeeeeeCcDIIIIiiiiUUUUuuuuNnSsYyyZz";
for (var y = 0; y < strAccentsLen; y++) {
if (accents.indexOf(strAccents[y]) != -1) {
strAccentsOut[y] = accentsOut.substr(accents.indexOf(strAccents[y]), 1);
} else
strAccentsOut[y] = strAccents[y];
}
strAccentsOut = strAccentsOut.join('');
return strAccentsOut;
}

Si vous souhaitez également supprimer les caractères spéciaux et de transformation des espaces et des tirets de soulignement, faites ceci:

string = remove_accents(string);
string = string.replace(/[^a-z0-9\s]/gi, '').replace(/[-\s]/g, '_');

Soin d'expliquer pourquoi le downvote?
J'ai voté pour vous. Simple et facile. Merci!

InformationsquelleAutor Lucas Bustamante

Voici ma version modifiée de lehelk.com's version qui supprime également les entités html sont des accents :

http://jsfiddle.net/billybraga/UHmnf/

Je ne sais toujours pas sur les performances, mais...

var defaultDiacriticsRemovalMap = [{
'base': "A",
'letters': /(&#65;|&#9398;|&#65313;|&#192;|&#193;|&#194;|&#7846;|&#7844;|&#7850;|&#7848;|&#195;|&#256;|&#258;|&#7856;|&#7854;|&#7860;|&#7858;|&#550;|&#480;|&#196;|&#478;|&#7842;|&#197;|&#506;|&#461;|&#512;|&#514;|&#7840;|&#7852;|&#7862;|&#7680;|&#260;|&#570;|&#11375;|[\u0041\u24B6\uFF21\u00C0\u00C1\u00C2\u1EA6\u1EA4\u1EAA\u1EA8\u00C3\u0100\u0102\u1EB0\u1EAE\u1EB4\u1EB2\u0226\u01E0\u00C4\u01DE\u1EA2\u00C5\u01FA\u01CD\u0200\u0202\u1EA0\u1EAC\u1EB6\u1E00\u0104\u023A\u2C6F])/g},
{
'base': "AA",
'letters': /(&#42802;|[\uA732])/g},
{
'base': "AE",
'letters': /(&#198;|&#508;|&#482;|[\u00C6\u01FC\u01E2])/g},
{
'base': "AO",
'letters': /(&#42804;|[\uA734])/g},
{
'base': "AU",
'letters': /(&#42806;|[\uA736])/g},
{
'base': "AV",
'letters': /(&#42808;|&#42810;|[\uA738\uA73A])/g},
{
'base': "AY",
'letters': /(&#42812;|[\uA73C])/g},
{
'base': "B",
'letters': /(&#66;|&#9399;|&#65314;|&#7682;|&#7684;|&#7686;|&#579;|&#386;|&#385;|[\u0042\u24B7\uFF22\u1E02\u1E04\u1E06\u0243\u0182\u0181])/g},
{
'base': "C",
'letters': /(&#67;|&#9400;|&#65315;|&#262;|&#264;|&#266;|&#268;|&#199;|&#7688;|&#391;|&#571;|&#42814;|[\u0043\u24B8\uFF23\u0106\u0108\u010A\u010C\u00C7\u1E08\u0187\u023B\uA73E])/g},
{
'base': "D",
'letters': /(&#68;|&#9401;|&#65316;|&#7690;|&#270;|&#7692;|&#7696;|&#7698;|&#7694;|&#272;|&#395;|&#394;|&#393;|&#42873;|[\u0044\u24B9\uFF24\u1E0A\u010E\u1E0C\u1E10\u1E12\u1E0E\u0110\u018B\u018A\u0189\uA779])/g},
{
'base': "DZ",
'letters': /(&#497;|&#452;|[\u01F1\u01C4])/g},
{
'base': "Dz",
'letters': /(&#498;|&#453;|[\u01F2\u01C5])/g},
{
'base': "E",
'letters': /(&#69;|&#9402;|&#65317;|&#200;|&#201;|&#202;|&#7872;|&#7870;|&#7876;|&#7874;|&#7868;|&#274;|&#7700;|&#7702;|&#276;|&#278;|&#203;|&#7866;|&#282;|&#516;|&#518;|&#7864;|&#7878;|&#552;|&#7708;|&#280;|&#7704;|&#7706;|&#400;|&#398;|[\u0045\u24BA\uFF25\u00C8\u00C9\u00CA\u1EC0\u1EBE\u1EC4\u1EC2\u1EBC\u0112\u1E14\u1E16\u0114\u0116\u00CB\u1EBA\u011A\u0204\u0206\u1EB8\u1EC6\u0228\u1E1C\u0118\u1E18\u1E1A\u0190\u018E])/g},
{
'base': "F",
'letters': /(&#70;|&#9403;|&#65318;|&#7710;|&#401;|&#42875;|[\u0046\u24BB\uFF26\u1E1E\u0191\uA77B])/g},
{
'base': "G",
'letters': /(&#71;|&#9404;|&#65319;|&#500;|&#284;|&#7712;|&#286;|&#288;|&#486;|&#290;|&#484;|&#403;|&#42912;|&#42877;|&#42878;|[\u0047\u24BC\uFF27\u01F4\u011C\u1E20\u011E\u0120\u01E6\u0122\u01E4\u0193\uA7A0\uA77D\uA77E])/g},
{
'base': "H",
'letters': /(&#72;|&#9405;|&#65320;|&#292;|&#7714;|&#7718;|&#542;|&#7716;|&#7720;|&#7722;|&#294;|&#11367;|&#11381;|&#42893;|[\u0048\u24BD\uFF28\u0124\u1E22\u1E26\u021E\u1E24\u1E28\u1E2A\u0126\u2C67\u2C75\uA78D])/g},
{
'base': "I",
'letters': /(&#73;|&#9406;|&#65321;|&#204;|&#205;|&#206;|&#296;|&#298;|&#300;|&#304;|&#207;|&#7726;|&#7880;|&#463;|&#520;|&#522;|&#7882;|&#302;|&#7724;|&#407;|[\u0049\u24BE\uFF29\u00CC\u00CD\u00CE\u0128\u012A\u012C\u0130\u00CF\u1E2E\u1EC8\u01CF\u0208\u020A\u1ECA\u012E\u1E2C\u0197])/g},
{
'base': "J",
'letters': /(&#74;|&#9407;|&#65322;|&#308;|&#584;|[\u004A\u24BF\uFF2A\u0134\u0248])/g},
{
'base': "K",
'letters': /(&#75;|&#9408;|&#65323;|&#7728;|&#488;|&#7730;|&#310;|&#7732;|&#408;|&#11369;|&#42816;|&#42818;|&#42820;|&#42914;|[\u004B\u24C0\uFF2B\u1E30\u01E8\u1E32\u0136\u1E34\u0198\u2C69\uA740\uA742\uA744\uA7A2])/g},
{
'base': "L",
'letters': /(&#76;|&#9409;|&#65324;|&#319;|&#313;|&#317;|&#7734;|&#7736;|&#315;|&#7740;|&#7738;|&#321;|&#573;|&#11362;|&#11360;|&#42824;|&#42822;|&#42880;|[\u004C\u24C1\uFF2C\u013F\u0139\u013D\u1E36\u1E38\u013B\u1E3C\u1E3A\u0141\u023D\u2C62\u2C60\uA748\uA746\uA780])/g},
{
'base': "LJ",
'letters': /(&#455;|[\u01C7])/g},
{
'base': "Lj",
'letters': /(&#456;|[\u01C8])/g},
{
'base': "M",
'letters': /(&#77;|&#9410;|&#65325;|&#7742;|&#7744;|&#7746;|&#11374;|&#412;|[\u004D\u24C2\uFF2D\u1E3E\u1E40\u1E42\u2C6E\u019C])/g},
{
'base': "N",
'letters': /(&#78;|&#9411;|&#65326;|&#504;|&#323;|&#209;|&#7748;|&#327;|&#7750;|&#325;|&#7754;|&#7752;|&#544;|&#413;|&#42896;|&#42916;|[\u004E\u24C3\uFF2E\u01F8\u0143\u00D1\u1E44\u0147\u1E46\u0145\u1E4A\u1E48\u0220\u019D\uA790\uA7A4])/g},
{
'base': "NJ",
'letters': /(&#458;|[\u01CA])/g},
{
'base': "Nj",
'letters': /(&#459;|[\u01CB])/g},
{
'base': "O",
'letters': /(&#79;|&#9412;|&#65327;|&#210;|&#211;|&#212;|&#7890;|&#7888;|&#7894;|&#7892;|&#213;|&#7756;|&#556;|&#7758;|&#332;|&#7760;|&#7762;|&#334;|&#558;|&#560;|&#214;|&#554;|&#7886;|&#336;|&#465;|&#524;|&#526;|&#416;|&#7900;|&#7898;|&#7904;|&#7902;|&#7906;|&#7884;|&#7896;|&#490;|&#492;|&#216;|&#510;|&#390;|&#415;|&#42826;|&#42828;|[\u004F\u24C4\uFF2F\u00D2\u00D3\u00D4\u1ED2\u1ED0\u1ED6\u1ED4\u00D5\u1E4C\u022C\u1E4E\u014C\u1E50\u1E52\u014E\u022E\u0230\u00D6\u022A\u1ECE\u0150\u01D1\u020C\u020E\u01A0\u1EDC\u1EDA\u1EE0\u1EDE\u1EE2\u1ECC\u1ED8\u01EA\u01EC\u00D8\u01FE\u0186\u019F\uA74A\uA74C])/g},
{
'base': "OI",
'letters': /(&#418;|[\u01A2])/g},
{
'base': "OO",
'letters': /(&#42830;|[\uA74E])/g},
{
'base': "OU",
'letters': /(&#546;|[\u0222])/g},
{
'base': "P",
'letters': /(&#80;|&#9413;|&#65328;|&#7764;|&#7766;|&#420;|&#11363;|&#42832;|&#42834;|&#42836;|[\u0050\u24C5\uFF30\u1E54\u1E56\u01A4\u2C63\uA750\uA752\uA754])/g},
{
'base': "Q",
'letters': /(&#81;|&#9414;|&#65329;|&#42838;|&#42840;|&#586;|[\u0051\u24C6\uFF31\uA756\uA758\u024A])/g},
{
'base': "R",
'letters': /(&#82;|&#9415;|&#65330;|&#340;|&#7768;|&#344;|&#528;|&#530;|&#7770;|&#7772;|&#342;|&#7774;|&#588;|&#11364;|&#42842;|&#42918;|&#42882;|[\u0052\u24C7\uFF32\u0154\u1E58\u0158\u0210\u0212\u1E5A\u1E5C\u0156\u1E5E\u024C\u2C64\uA75A\uA7A6\uA782])/g},
{
'base': "S",
'letters': /(&#83;|&#9416;|&#65331;|&#7838;|&#346;|&#7780;|&#348;|&#7776;|&#352;|&#7782;|&#7778;|&#7784;|&#536;|&#350;|&#11390;|&#42920;|&#42884;|[\u0053\u24C8\uFF33\u1E9E\u015A\u1E64\u015C\u1E60\u0160\u1E66\u1E62\u1E68\u0218\u015E\u2C7E\uA7A8\uA784])/g},
{
'base': "T",
'letters': /(&#84;|&#9417;|&#65332;|&#7786;|&#356;|&#7788;|&#538;|&#354;|&#7792;|&#7790;|&#358;|&#428;|&#430;|&#574;|&#42886;|[\u0054\u24C9\uFF34\u1E6A\u0164\u1E6C\u021A\u0162\u1E70\u1E6E\u0166\u01AC\u01AE\u023E\uA786])/g},
{
'base': "TZ",
'letters': /(&#42792;|[\uA728])/g},
{
'base': "U",
'letters': /(&#85;|&#9418;|&#65333;|&#217;|&#218;|&#219;|&#360;|&#7800;|&#362;|&#7802;|&#364;|&#220;|&#475;|&#471;|&#469;|&#473;|&#7910;|&#366;|&#368;|&#467;|&#532;|&#534;|&#431;|&#7914;|&#7912;|&#7918;|&#7916;|&#7920;|&#7908;|&#7794;|&#370;|&#7798;|&#7796;|&#580;|[\u0055\u24CA\uFF35\u00D9\u00DA\u00DB\u0168\u1E78\u016A\u1E7A\u016C\u00DC\u01DB\u01D7\u01D5\u01D9\u1EE6\u016E\u0170\u01D3\u0214\u0216\u01AF\u1EEA\u1EE8\u1EEE\u1EEC\u1EF0\u1EE4\u1E72\u0172\u1E76\u1E74\u0244])/g},
{
'base': "V",
'letters': /(&#86;|&#9419;|&#65334;|&#7804;|&#7806;|&#434;|&#42846;|&#581;|[\u0056\u24CB\uFF36\u1E7C\u1E7E\u01B2\uA75E\u0245])/g},
{
'base': "VY",
'letters': /(&#42848;|[\uA760])/g},
{
'base': "W",
'letters': /(&#87;|&#9420;|&#65335;|&#7808;|&#7810;|&#372;|&#7814;|&#7812;|&#7816;|&#11378;|[\u0057\u24CC\uFF37\u1E80\u1E82\u0174\u1E86\u1E84\u1E88\u2C72])/g},
{
'base': "X",
'letters': /(&#88;|&#9421;|&#65336;|&#7818;|&#7820;|[\u0058\u24CD\uFF38\u1E8A\u1E8C])/g},
{
'base': "Y",
'letters': /(&#89;|&#9422;|&#65337;|&#7922;|&#221;|&#374;|&#7928;|&#562;|&#7822;|&#376;|&#7926;|&#7924;|&#435;|&#590;|&#7934;|[\u0059\u24CE\uFF39\u1EF2\u00DD\u0176\u1EF8\u0232\u1E8E\u0178\u1EF6\u1EF4\u01B3\u024E\u1EFE])/g},
{
'base': "Z",
'letters': /(&#90;|&#9423;|&#65338;|&#377;|&#7824;|&#379;|&#381;|&#7826;|&#7828;|&#437;|&#548;|&#11391;|&#11371;|&#42850;|[\u005A\u24CF\uFF3A\u0179\u1E90\u017B\u017D\u1E92\u1E94\u01B5\u0224\u2C7F\u2C6B\uA762])/g},
{
'base': "a",
'letters': /(&#97;|&#9424;|&#65345;|&#7834;|&#224;|&#225;|&#226;|&#7847;|&#7845;|&#7851;|&#7849;|&#227;|&#257;|&#259;|&#7857;|&#7855;|&#7861;|&#7859;|&#551;|&#481;|&#228;|&#479;|&#7843;|&#229;|&#507;|&#462;|&#513;|&#515;|&#7841;|&#7853;|&#7863;|&#7681;|&#261;|&#11365;|&#592;|[\u0061\u24D0\uFF41\u1E9A\u00E0\u00E1\u00E2\u1EA7\u1EA5\u1EAB\u1EA9\u00E3\u0101\u0103\u1EB1\u1EAF\u1EB5\u1EB3\u0227\u01E1\u00E4\u01DF\u1EA3\u00E5\u01FB\u01CE\u0201\u0203\u1EA1\u1EAD\u1EB7\u1E01\u0105\u2C65\u0250])/g},
{
'base': "aa",
'letters': /(&#42803;|[\uA733])/g},
{
'base': "ae",
'letters': /(&#230;|&#509;|&#483;|[\u00E6\u01FD\u01E3])/g},
{
'base': "ao",
'letters': /(&#42805;|[\uA735])/g},
{
'base': "au",
'letters': /(&#42807;|[\uA737])/g},
{
'base': "av",
'letters': /(&#42809;|&#42811;|[\uA739\uA73B])/g},
{
'base': "ay",
'letters': /(&#42813;|[\uA73D])/g},
{
'base': "b",
'letters': /(&#98;|&#9425;|&#65346;|&#7683;|&#7685;|&#7687;|&#384;|&#387;|&#595;|[\u0062\u24D1\uFF42\u1E03\u1E05\u1E07\u0180\u0183\u0253])/g},
{
'base': "c",
'letters': /(&#99;|&#9426;|&#65347;|&#263;|&#265;|&#267;|&#269;|&#231;|&#7689;|&#392;|&#572;|&#42815;|&#8580;|[\u0063\u24D2\uFF43\u0107\u0109\u010B\u010D\u00E7\u1E09\u0188\u023C\uA73F\u2184])/g},
{
'base': "d",
'letters': /(&#100;|&#9427;|&#65348;|&#7691;|&#271;|&#7693;|&#7697;|&#7699;|&#7695;|&#273;|&#396;|&#598;|&#599;|&#42874;|[\u0064\u24D3\uFF44\u1E0B\u010F\u1E0D\u1E11\u1E13\u1E0F\u0111\u018C\u0256\u0257\uA77A])/g},
{
'base': "dz",
'letters': /(&#499;|&#454;|[\u01F3\u01C6])/g},
{
'base': "e",
'letters': /(&#101;|&#9428;|&#65349;|&#232;|&#233;|&#234;|&#7873;|&#7871;|&#7877;|&#7875;|&#7869;|&#275;|&#7701;|&#7703;|&#277;|&#279;|&#235;|&#7867;|&#283;|&#517;|&#519;|&#7865;|&#7879;|&#553;|&#7709;|&#281;|&#7705;|&#7707;|&#583;|&#603;|&#477;|[\u0065\u24D4\uFF45\u00E8\u00E9\u00EA\u1EC1\u1EBF\u1EC5\u1EC3\u1EBD\u0113\u1E15\u1E17\u0115\u0117\u00EB\u1EBB\u011B\u0205\u0207\u1EB9\u1EC7\u0229\u1E1D\u0119\u1E19\u1E1B\u0247\u025B\u01DD])/g},
{
'base': "f",
'letters': /(&#102;|&#9429;|&#65350;|&#7711;|&#402;|&#42876;|[\u0066\u24D5\uFF46\u1E1F\u0192\uA77C])/g},
{
'base': "g",
'letters': /(&#103;|&#9430;|&#65351;|&#501;|&#285;|&#7713;|&#287;|&#289;|&#487;|&#291;|&#485;|&#608;|&#42913;|&#7545;|&#42879;|[\u0067\u24D6\uFF47\u01F5\u011D\u1E21\u011F\u0121\u01E7\u0123\u01E5\u0260\uA7A1\u1D79\uA77F])/g},
{
'base': "h",
'letters': /(&#104;|&#9431;|&#65352;|&#293;|&#7715;|&#7719;|&#543;|&#7717;|&#7721;|&#7723;|&#7830;|&#295;|&#11368;|&#11382;|&#613;|[\u0068\u24D7\uFF48\u0125\u1E23\u1E27\u021F\u1E25\u1E29\u1E2B\u1E96\u0127\u2C68\u2C76\u0265])/g},
{
'base': "hv",
'letters': /(&#405;|[\u0195])/g},
{
'base': "i",
'letters': /(&#105;|&#9432;|&#65353;|&#236;|&#237;|&#238;|&#297;|&#299;|&#301;|&#239;|&#7727;|&#7881;|&#464;|&#521;|&#523;|&#7883;|&#303;|&#7725;|&#616;|&#305;|[\u0069\u24D8\uFF49\u00EC\u00ED\u00EE\u0129\u012B\u012D\u00EF\u1E2F\u1EC9\u01D0\u0209\u020B\u1ECB\u012F\u1E2D\u0268\u0131])/g},
{
'base': "j",
'letters': /(&#106;|&#9433;|&#65354;|&#309;|&#496;|&#585;|[\u006A\u24D9\uFF4A\u0135\u01F0\u0249])/g},
{
'base': "k",
'letters': /(&#107;|&#9434;|&#65355;|&#7729;|&#489;|&#7731;|&#311;|&#7733;|&#409;|&#11370;|&#42817;|&#42819;|&#42821;|&#42915;|[\u006B\u24DA\uFF4B\u1E31\u01E9\u1E33\u0137\u1E35\u0199\u2C6A\uA741\uA743\uA745\uA7A3])/g},
{
'base': "l",
'letters': /(&#108;|&#9435;|&#65356;|&#320;|&#314;|&#318;|&#7735;|&#7737;|&#316;|&#7741;|&#7739;|&#383;|&#322;|&#410;|&#619;|&#11361;|&#42825;|&#42881;|&#42823;|[\u006C\u24DB\uFF4C\u0140\u013A\u013E\u1E37\u1E39\u013C\u1E3D\u1E3B\u017F\u0142\u019A\u026B\u2C61\uA749\uA781\uA747])/g},
{
'base': "lj",
'letters': /(&#457;|[\u01C9])/g},
{
'base': "m",
'letters': /(&#109;|&#9436;|&#65357;|&#7743;|&#7745;|&#7747;|&#625;|&#623;|[\u006D\u24DC\uFF4D\u1E3F\u1E41\u1E43\u0271\u026F])/g},
{
'base': "n",
'letters': /(&#110;|&#9437;|&#65358;|&#505;|&#324;|&#241;|&#7749;|&#328;|&#7751;|&#326;|&#7755;|&#7753;|&#414;|&#626;|&#329;|&#42897;|&#42917;|[\u006E\u24DD\uFF4E\u01F9\u0144\u00F1\u1E45\u0148\u1E47\u0146\u1E4B\u1E49\u019E\u0272\u0149\uA791\uA7A5])/g},
{
'base': "nj",
'letters': /(&#460;|[\u01CC])/g},
{
'base': "o",
'letters': /(&#111;|&#9438;|&#65359;|&#242;|&#243;|&#244;|&#7891;|&#7889;|&#7895;|&#7893;|&#245;|&#7757;|&#557;|&#7759;|&#333;|&#7761;|&#7763;|&#335;|&#559;|&#561;|&#246;|&#555;|&#7887;|&#337;|&#466;|&#525;|&#527;|&#417;|&#7901;|&#7899;|&#7905;|&#7903;|&#7907;|&#7885;|&#7897;|&#491;|&#493;|&#248;|&#511;|&#596;|&#42827;|&#42829;|&#629;|[\u006F\u24DE\uFF4F\u00F2\u00F3\u00F4\u1ED3\u1ED1\u1ED7\u1ED5\u00F5\u1E4D\u022D\u1E4F\u014D\u1E51\u1E53\u014F\u022F\u0231\u00F6\u022B\u1ECF\u0151\u01D2\u020D\u020F\u01A1\u1EDD\u1EDB\u1EE1\u1EDF\u1EE3\u1ECD\u1ED9\u01EB\u01ED\u00F8\u01FF\u0254\uA74B\uA74D\u0275])/g},
{
'base': "oi",
'letters': /(&#419;|[\u01A3])/g},
{
'base': "ou",
'letters': /(&#547;|[\u0223])/g},
{
'base': "oo",
'letters': /(&#42831;|[\uA74F])/g},
{
'base': "p",
'letters': /(&#112;|&#9439;|&#65360;|&#7765;|&#7767;|&#421;|&#7549;|&#42833;|&#42835;|&#42837;|[\u0070\u24DF\uFF50\u1E55\u1E57\u01A5\u1D7D\uA751\uA753\uA755])/g},
{
'base': "q",
'letters': /(&#113;|&#9440;|&#65361;|&#587;|&#42839;|&#42841;|[\u0071\u24E0\uFF51\u024B\uA757\uA759])/g},
{
'base': "r",
'letters': /(&#114;|&#9441;|&#65362;|&#341;|&#7769;|&#345;|&#529;|&#531;|&#7771;|&#7773;|&#343;|&#7775;|&#589;|&#637;|&#42843;|&#42919;|&#42883;|[\u0072\u24E1\uFF52\u0155\u1E59\u0159\u0211\u0213\u1E5B\u1E5D\u0157\u1E5F\u024D\u027D\uA75B\uA7A7\uA783])/g},
{
'base': "s",
'letters': /(&#115;|&#9442;|&#65363;|&#223;|&#347;|&#7781;|&#349;|&#7777;|&#353;|&#7783;|&#7779;|&#7785;|&#537;|&#351;|&#575;|&#42921;|&#42885;|&#7835;|[\u0073\u24E2\uFF53\u00DF\u015B\u1E65\u015D\u1E61\u0161\u1E67\u1E63\u1E69\u0219\u015F\u023F\uA7A9\uA785\u1E9B])/g},
{
'base': "t",
'letters': /(&#116;|&#9443;|&#65364;|&#7787;|&#7831;|&#357;|&#7789;|&#539;|&#355;|&#7793;|&#7791;|&#359;|&#429;|&#648;|&#11366;|&#42887;|[\u0074\u24E3\uFF54\u1E6B\u1E97\u0165\u1E6D\u021B\u0163\u1E71\u1E6F\u0167\u01AD\u0288\u2C66\uA787])/g},
{
'base': "tz",
'letters': /(&#42793;|[\uA729])/g},
{
'base': "u",
'letters': /(&#117;|&#9444;|&#65365;|&#249;|&#250;|&#251;|&#361;|&#7801;|&#363;|&#7803;|&#365;|&#252;|&#476;|&#472;|&#470;|&#474;|&#7911;|&#367;|&#369;|&#468;|&#533;|&#535;|&#432;|&#7915;|&#7913;|&#7919;|&#7917;|&#7921;|&#7909;|&#7795;|&#371;|&#7799;|&#7797;|&#649;|[\u0075\u24E4\uFF55\u00F9\u00FA\u00FB\u0169\u1E79\u016B\u1E7B\u016D\u00FC\u01DC\u01D8\u01D6\u01DA\u1EE7\u016F\u0171\u01D4\u0215\u0217\u01B0\u1EEB\u1EE9\u1EEF\u1EED\u1EF1\u1EE5\u1E73\u0173\u1E77\u1E75\u0289])/g},
{
'base': "v",
'letters': /(&#118;|&#9445;|&#65366;|&#7805;|&#7807;|&#651;|&#42847;|&#652;|[\u0076\u24E5\uFF56\u1E7D\u1E7F\u028B\uA75F\u028C])/g},
{
'base': "vy",
'letters': /(&#42849;|[\uA761])/g},
{
'base': "w",
'letters': /(&#119;|&#9446;|&#65367;|&#7809;|&#7811;|&#373;|&#7815;|&#7813;|&#7832;|&#7817;|&#11379;|[\u0077\u24E6\uFF57\u1E81\u1E83\u0175\u1E87\u1E85\u1E98\u1E89\u2C73])/g},
{
'base': "x",
'letters': /(&#120;|&#9447;|&#65368;|&#7819;|&#7821;|[\u0078\u24E7\uFF58\u1E8B\u1E8D])/g},
{
'base': "y",
'letters': /(&#121;|&#9448;|&#65369;|&#7923;|&#253;|&#375;|&#7929;|&#563;|&#7823;|&#255;|&#7927;|&#7833;|&#7925;|&#436;|&#591;|&#7935;|[\u0079\u24E8\uFF59\u1EF3\u00FD\u0177\u1EF9\u0233\u1E8F\u00FF\u1EF7\u1E99\u1EF5\u01B4\u024F\u1EFF])/g},
{
'base': "z",
'letters': /(&#122;|&#9449;|&#65370;|&#378;|&#7825;|&#380;|&#382;|&#7827;|&#7829;|&#438;|&#549;|&#576;|&#11372;|&#42851;|[\u007A\u24E9\uFF5A\u017A\u1E91\u017C\u017E\u1E93\u1E95\u01B6\u0225\u0240\u2C6C\uA763])/g}];
function removeDiacritics(str) {
for (var i = 0; i < defaultDiacriticsRemovalMap.length; i++) {
str = str.replace(defaultDiacriticsRemovalMap[i].letters, defaultDiacriticsRemovalMap[i].base);
}
return str;
}

InformationsquelleAutor billy

Voici une solution très simple, sans trop de code à l'aide d'une très simple carte de signes diacritiques qui comprend que la carte d'équivalents ascii contenant plus d'un caractère, c'est à dire Æ => AE, ffi => ffi, etc... Également inclus des tests fonctionnels

var diacriticsMap = {
'\u00C0': 'A',  //À => A
'\u00C1': 'A',   //Á => A
'\u00C2': 'A',   //Â => A
'\u00C3': 'A',   //Ã => A
'\u00C4': 'A',   //Ä => A
'\u00C5': 'A',   //Å => A
'\u00C6': 'AE', //Æ => AE
'\u00C7': 'C',   //Ç => C
'\u00C8': 'E',   //È => E
'\u00C9': 'E',   //É => E
'\u00CA': 'E',   //Ê => E
'\u00CB': 'E',   //Ë => E
'\u00CC': 'I',   //Ì => I
'\u00CD': 'I',   //Í => I
'\u00CE': 'I',   //Î => I
'\u00CF': 'I',   //Ï => I
'\u0132': 'IJ', //Ĳ => IJ
'\u00D0': 'D',   //Ð => D
'\u00D1': 'N',   //Ñ => N
'\u00D2': 'O',   //Ò => O
'\u00D3': 'O',   //Ó => O
'\u00D4': 'O',   //Ô => O
'\u00D5': 'O',   //Õ => O
'\u00D6': 'O',   //Ö => O
'\u00D8': 'O',   //Ø => O
'\u0152': 'OE', //Œ => OE
'\u00DE': 'TH', //Þ => TH
'\u00D9': 'U',   //Ù => U
'\u00DA': 'U',   //Ú => U
'\u00DB': 'U',   //Û => U
'\u00DC': 'U',   //Ü => U
'\u00DD': 'Y',   //Ý => Y
'\u0178': 'Y',   //Ÿ => Y
'\u00E0': 'a',   //à => a
'\u00E1': 'a',   //á => a
'\u00E2': 'a',   //â => a
'\u00E3': 'a',   //ã => a
'\u00E4': 'a',   //ä => a
'\u00E5': 'a',   //å => a
'\u00E6': 'ae', //æ => ae
'\u00E7': 'c',   //ç => c
'\u00E8': 'e',   //è => e
'\u00E9': 'e',   //é => e
'\u00EA': 'e',   //ê => e
'\u00EB': 'e',   //ë => e
'\u00EC': 'i',   //ì => i
'\u00ED': 'i',   //í => i
'\u00EE': 'i',   //î => i
'\u00EF': 'i',   //ï => i
'\u0133': 'ij', //ĳ => ij
'\u00F0': 'd',   //ð => d
'\u00F1': 'n',   //ñ => n
'\u00F2': 'o',   //ò => o
'\u00F3': 'o',   //ó => o
'\u00F4': 'o',   //ô => o
'\u00F5': 'o',   //õ => o
'\u00F6': 'o',   //ö => o
'\u00F8': 'o',   //ø => o
'\u0153': 'oe', //œ => oe
'\u00DF': 'ss', //ß => ss
'\u00FE': 'th', //þ => th
'\u00F9': 'u',   //ù => u
'\u00FA': 'u',   //ú => u
'\u00FB': 'u',   //û => u
'\u00FC': 'u',   //ü => u
'\u00FD': 'y',   //ý => y
'\u00FF': 'y',   //ÿ => y
'\uFB00': 'ff', //ﬀ => ff
'\uFB01': 'fi',   //ﬁ => fi
'\uFB02': 'fl', //ﬂ => fl
'\uFB03': 'ffi',  //ﬃ => ffi
'\uFB04': 'ffl',  //ﬄ => ffl
'\uFB05': 'ft', //ﬅ => ft
'\uFB06': 'st'  //ﬆ => st
};
function replaceDiacritics(str) {
var returnStr = '';
if(str) {
for (var i = 0; i < str.length; i++) {
if (diacriticsMap[str[i]]) {
returnStr += diacriticsMap[str[i]];
} else {
returnStr += str[i];
}
}
}
return returnStr;
}
function testStripDiacritics(input, expected) {
var coChar = replaceDiacritics(input);
console.log('The character passed in was ' + input);
console.log('The character that came out was ' + coChar);
console.log('The character expected was' + expected);
}
testStripDiacritics('À','A');
testStripDiacritics('A','A');
testStripDiacritics('Æ','AE');
testStripDiacritics('AE','AE');
testStripDiacritics('ÇhÀrlËšYŸZŽ','ChArlEsYYZZ');

C'est loin d'être complète, mais vos mappages sont grands pour le pré-traitement des chaînes de recherche parce qu'ils correctement assumer ce que les locuteurs de l'anglais serait de type, par exemple, peut-être Ä -> Ae est correct, mais Ä -> A est plus probable que les locuteurs de l'anglais allez taper. Je vais traiter mes cordes avec cela, suivie par la .normalize() fonction par Lewis réponse. Grand que vous attraper, Ø - > O, mais j'aurai besoin d'ajouter ł -> l 😉

InformationsquelleAutor Bradley D

2

merci à tous

J'utilise cette version et dire pourquoi (parce que je manque des explications au début, j'ai donc essayer d'aider le prochain lecteur s'il est aussi terne que moi ...)

Remarque : je voulais une solution efficace, donc :
- seulement une regexp compilation (si nécessaire)
- qu'une chaîne de numérisation pour chaque chaîne
- un moyen efficace pour trouver la traduction des caractères
  etc ...
Ma version est :

(il n'y a pas de nouvelle astuce technique à l'intérieur, seuls quelques élus + explications)
```
makeSortString = (function() {
var translate_re = /[¹²³áàâãäåaaaÀÁÂÃÄÅAAAÆccç©CCÇÐÐèéê?ëeeeeeÈÊË?EEEEE€gGiìíîïìiiiÌÍÎÏ?ÌIIIlLnnñNNÑòóôõöoooøÒÓÔÕÖOOOØŒr®Ršs?ßŠS?ùúûüuuuuÙÚÛÜUUUUýÿÝŸžzzŽZZ]/g;
var translate = {
"¹":"1","²":"2","³":"3","á":"a","à":"a","â":"a","ã":"a","ä":"a","å":"a","a":"a","a":"a","a":"a","À":"a","Á":"a","Â":"a","Ã":"a","Ä":"a","Å":"a","A":"a","A":"a",
"A":"a","Æ":"a","c":"c","c":"c","ç":"c","©":"c","C":"c","C":"c","Ç":"c","Ð":"d","Ð":"d","è":"e","é":"e","ê":"e","?":"e","ë":"e","e":"e","e":"e","e":"e","e":"e",
"e":"e","È":"e","Ê":"e","Ë":"e","?":"e","E":"e","E":"e","E":"e","E":"e","E":"e","€":"e","g":"g","G":"g","i":"i","ì":"i","í":"i","î":"i","ï":"i","ì":"i","i":"i",
"i":"i","i":"i","Ì":"i","Í":"i","Î":"i","Ï":"i","?":"i","Ì":"i","I":"i","I":"i","I":"i","l":"l","L":"l","n":"n","n":"n","ñ":"n","N":"n","N":"n","Ñ":"n","ò":"o",
"ó":"o","ô":"o","õ":"o","ö":"o","o":"o","o":"o","o":"o","ø":"o","Ò":"o","Ó":"o","Ô":"o","Õ":"o","Ö":"o","O":"o","O":"o","O":"o","Ø":"o","Œ":"o","r":"r","®":"r",
"R":"r","š":"s","s":"s","?":"s","ß":"s","Š":"s","S":"s","?":"s","ù":"u","ú":"u","û":"u","ü":"u","u":"u","u":"u","u":"u","u":"u","Ù":"u","Ú":"u","Û":"u","Ü":"u",
"U":"u","U":"u","U":"u","U":"u","ý":"y","ÿ":"y","Ý":"y","Ÿ":"y","ž":"z","z":"z","z":"z","Ž":"z","Z":"z","Z":"z"
};
return function(s) {
return(s.replace(translate_re, function(match){return translate[match];}) );
}
})();
```
et je l'utilise de cette façon :
```
var without_accents = makeSortString("wïthêüÄTrèsBïgüeAk100t");
//I let you guess the result,
//no I was kidding you : I give you the result : witheuatresbigueak100t
```
Commentaires :
- L'instruction à l'intérieur, il est fait une fois (après, makeSortString != undefined)
- function(){...} est stockée une fois dans makeSortString, de sorte que le "gros" translate_re et traduire les objets sont stockés qu'une seule fois
- Lorsque vous appelez makeSortString ("quelque chose"), il téléphoner directement à l'intérieur de la fonction qui appelle s seul.remplacer(...) : il est efficace
- s.remplacer les utilisations regexp (la syntaxe particulière du var translate_re= .... est en fait l'équivalent de var translate_re = new RegExp("[1....Z]","g"); mais la compilation de la regexp est faite une fois pour toutes, et que l'analyse de la Chaîne est fait l'un pour l'appel de la fonction (et non pas pour chaque personnage, comme il le serait dans une boucle)
- Pour chaque caractère s.remplacer les appels de fonction(match) où le paramètre match contient le caractère trouvé, et il a fait appel de la traduction correspondante de caractères (traduire[match])
- Traduire[match] est probablement efficace aussi, comme le javascript traduire objet est probablement mis en œuvre par javascript avec un hashtab ou quelque chose d'équivalent et que le programme pour trouver le traduit le caractère presque directement et pas par exemple à travers une boucle sur un tableau de tous les personnages de trouver la bonne (ce qui serait drôlement unefficient).
InformationsquelleAutor Herve
2

Je fournis cette réponse pour une question similaire. Il est basé sur rapide tableau de la recherche de remplacement pour certains caractères latins (1+2), l'un pour l'autre (impossible de changer l'allemand ü pour "ue"), mais fonctionne bien pour la base de "normalisation" ASCII de 7 bits.
```
TAB_00C0 = "AAAAAAACEEEEIIII" +
"DNOOOOO*OUUUUYIs" +
"aaaaaaaceeeeiiii" +
"?nooooo/ouuuuy?y" +
"AaAaAaCcCcCcCcDd" +
"DdEeEeEeEeEeGgGg" +
"GgGgHhHhIiIiIiIi" +
"IiJjJjKkkLlLlLlL" +
"lLlNnNnNnnNnOoOo" +
"OoOoRrRrRrSsSsSs" +
"SsTtTtTtUuUuUuUu" +
"UuUuWwYyYZzZzZzF";
function stripDiacritics(source) {
var result = source.split('');
for (var i = 0; i < result.length; i++) {
var c = source.charCodeAt(i);
if (c >= 0x00c0 && c <= 0x017f) {
result[i] = String.fromCharCode(TAB_00C0.charCodeAt(c - 0x00c0));
} else if (c > 127) {
result[i] = '?';
}
}
return result.join('');
}
stripDiacritics("Šupa, čo? ľšťčžýæøåℌð")
```
Les autres caractères sont convertis ?, qui est le résultat est certainement l'ASCII 7 bits. Pas de regex, pas de magie, simple char tableau de travail.
- Nous avons testé les performances de ce et à ma grande surprise, c'est un peu plus lent que str.normalize('NFD').replace(/[\u0300-\u036f]/g, "") version. Maintenant - ce qui est bon pour le plus général, celui-liner. Chose étrange, c'est que dans Java boucle version est beaucoup plus rapide, mais il est basé sur StringBuilder. Je ne suis pas sûr de savoir si split/join est à blâmer, mais au moins je sais que je peux oublier cette version de JS/web. 🙂
InformationsquelleAutor virgo47
2

J'ai utilisé string.js's latinise() méthode, qui permet de faire comme ceci:
```
var output = S(input).latinise().toString();
```
InformationsquelleAutor houbysoft
1

En supposant que vous savez ce que vous faites, je soupçonne IE6 n'est pas l'interprétation de l'encodage du fichier correctement, et donc en ne reconnaissant pas les caractères non-ASCII dans le fichier:
- Assurez-vous que le fichier est enregistré en UTF-8 (par exemple)
- Utiliser Fiddler ou un autre outil pour vérifier que le serveur web envoie le bon Encodage de Contenu d'en-tête HTTP.
(Il "sent" mal, j'aurais l'air en faisant le tri, par exemple sur le serveur à l'aide de quelque chose qui est locale-courant... mais quand même...)
- C'est une vieille question, j'ai juste édité. Vous avez raison, c'était une question de codage (IE6 ne reconnaît pas le charset 'utf-8', mais seulement 'UTF-8'). Bien qu'il n'y a pas de point est de faire un tri sur le serveur, en particulier lors de l'affichage d'une longue table avec plusieurs colonnes triables. +1 pour le codage de mentionner ce qui a été le dernier vrai problème.
InformationsquelleAutor Duncan Smart
1

Passer d'une fonction définie par l'utilisateur à l' Array.sort() méthode, et dans cette fonction définie par l'utilisateur utilisation String.localeCompare()
```
function myCompareFunction(a, b) {
return a.localeCompare(b);
}
var values = ["pêches", "épinards", "tomates", "fraises"];
//WRONG: ["fraises", "pêches", "tomates", "épinards"]
values.sort();
//**GOOD**: ["épinards", "fraises", "pêches", "tomates"]
values.sort(myCompareFunction);
```
- Hm, le tableau ["ép", "ep", "fp"] est triée comme ["ep", "fp", "ép"]. Savez-vous pourquoi la lettre f est entre les lettres e et è?
- Hmmm merde, je l'ai testé sur google chrome et il ne parvient pas là. Dans Firefox fonctionne bien.
InformationsquelleAutor Carlos Campderrós

Ce fait pour moi. JavaScript, Scripts Google Apps, GAZ

function normalizetext(text) {
var weird = 'öüóőúéáàűíÖÜÓŐÚÉÁÀŰÍçÇ!@£$%^&*()_+?/*."';
var normalized = 'ouooueaauiOUOOUEAAUIcC                 ';
var idoff = -1,new_text = '';
var lentext = text.toString().length -1
for (i = 0; i <= lentext; i++) {
idoff = weird.search(text.charAt(i));
if (idoff == -1) {
new_text = new_text + text.charAt(i);
} else {
new_text = new_text + normalized.charAt(idoff);
}
}
return new_text;
}

Cela ne fonctionne que si tous vos personnages sont dans cette chaîne. Aussi, grand temps/mémoire de complexité, mais si vous ne faites pas de gros travaux, c'est bien.

InformationsquelleAutor JaimeJCandau

function removeAccents(strAccents){
strAccents = strAccents.split('');
strAccentsOut = new Array();
strAccentsLen = strAccents.length;
var accents = 'ÀÁÂÃÄÅàáâãäåÒÓÔÕÕÖØòóôõöøÈÉÊËèéêëðÇçÐÌÍÎÏìíîïÙÚÛÜùúûüÑñŠšŸÿýŽž';
var accentsOut = ['A','A','A','A','A','A','a','a','a','a','a','a','O','O','O','O','O','O','O','o','o','o','o','o','o','E','E','E','E','e','e','e','e','e','C','c','D','I','I','I','I','i','i','i','i','U','U','U','U','u','u','u','u','N','n','S','s','Y','y','y','Z','z'];
for (var y = 0; y < strAccentsLen; y++) {
if (accents.indexOf(strAccents[y]) != -1) {
strAccentsOut[y] = accentsOut[accents.indexOf(strAccents[y])];
}
else
strAccentsOut[y] = strAccents[y];
}
strAccentsOut = strAccentsOut.join('');
return strAccentsOut;
}

Êtes-vous sûr que vous avez pris tous? (čŘůľě)
ăĂâÂțȚţŢșȘşŞ Vous gotta catch 'em all 🙂

InformationsquelleAutor Álister

0

Je sais que c'est de la "triche" pour ce faire, sur le côté serveur, mais la semaine dernière j'ai eu une tâche similaire en Javascript et j'ai introduit un simple servlet java et supprimé les accents en Java. C'était très rapide 🙂
- Je ne considère pas ça de la triche, c'est juste une question d'exigences 😉
InformationsquelleAutor István

J'ai trouvé toutes ces un peu maladroite et je ne suis pas trop expert sur les expressions régulières, voici donc une version plus simple. Il serait assez facile de le traduire à vos favoris langage côté serveur, en supposant que la chaîne de caractères déjà en Unicode:

//String containing replacement characters for stripping accents 
var stripstring = 
'AAAAAAACEEEEIIII'+
'DNOOOOO.OUUUUY..'+
'aaaaaaaceeeeiiii'+
'dnooooo.ouuuuy.y'+
'AaAaAaCcCcCcCcDd'+
'DdEeEeEeEeEeGgGg'+
'GgGgHhHhIiIiIiIi'+
'IiIiJjKkkLlLlLlL'+
'lJlNnNnNnnNnOoOo'+
'OoOoRrRrRrSsSsSs'+
'SsTtTtTtUuUuUuUu'+
'UuUuWwYyYZzZzZz.';
function stripaccents(str){
var answer='';
for(var i=0;i<str.length;i++){
var ch=str[i];
var chindex=ch.charCodeAt(0)-192;   //Index of character code in the strip string
if(chindex>=0 && chindex<stripstring.length){
//Character is within our table, so we can strip the accent...
var outch=stripstring.charAt(chindex);
//...unless it was shown as a '.'
if(outch!='.')ch=outch;
}
answer+=ch;
}
return answer;
}

InformationsquelleAutor xgretsch

0

Vous pouvez créer des regex dans de multiples façons. À l'aide de la nouvelle RegExp-constructeur:
```
var re = new RegExp("[a-z]", "ig") //(string pattern, string modifiers)
```
Ou en utilisant les regex notation littérale:
```
var re = /[a-z]/ig; ///pattern/modifiers
```
Vous avez mélangé les deux.
- C'est un commentaire, pas une réponse.
InformationsquelleAutor Pim Jager
0

Si vous êtes ouvert à l'aide d'une bibliothèque, vous pouvez utiliser String.js latinize:
http://stringjs.com/#methods/latinise

InformationsquelleAutor ooolala

$scope.legal_name = $sanitize($scope.legal_name);
console.log("Name before function...",$scope.legal_name);
var str = "";
for(var i=0; i < $scope.legal_name.length; i++) {
var charName = $scope.legal_name.charAt(i);
if((charName == '&') && ($scope.legal_name.charAt(i + 1) == '#')){
var count = 0;
var subString = "";
while(true) {
if(($scope.legal_name.charCodeAt(i + 2 + count) > 47) && ($scope.legal_name.charCodeAt(i + 1 + count) < 58 )) {
subString = subString + $scope.legal_name.charAt(i + 2 + count);
count++;
} else {
if(subString.length > 0) {
var value = parseInt(subString);
str = str + String.fromCharCode(value);
i = i + 1 + count; 
break;
}
}
}               
} else {
str = str + charName;
}
}
$scope.legal_name = str;
console.log("Name After function...",str);

Veuillez expliquer votre code. Ce serait la réponse est encore mieux!
u sera mis sur la valeur de "$champ d'application.legal_name" comme : $champ d'application.legal_name = P&#256n&#256m&#256 il vous permet de convertir toutes les valeurs ASCII vers leur caractères respectifs "Pánámá"

InformationsquelleAutor Himanshu Teotia

0

La retirez-les accents MNP est un forfait de manière assez facile de traiter ces questions:
```
var input = 'ÀÁÂÃÄÅ';
var output = removeAccents(input);
console.log(output); //AAAAAA
```
InformationsquelleAutor Mureinik
-2

Tous les ci-dessus ne fonctionne pas avec décomposé caractère utilisé sur Mac OS.
Afin de supprimer les signes diacritiques dans ce cas, il est plus simple :
```
r = r.replace(new RegExp(/[\u0300-\u036f]/g),"")
```
voir le commentaire de Olivier Miakinen sur :
https://groups.google.com/d/msg/fr.comp.lang.regexp/6IGJTbedGTM/G0sB2kAsR34J
(publié en français)

InformationsquelleAutor user2909737

Vous devez vous connecter pour publier un commentaire.