Python ont une fonction intégrée de la chaîne naturelle de tri?

À L'Aide De Python 3.x, j'ai une liste de chaînes de caractères, et j'aimerais effectuer un naturel tri alphabétique.

Naturel de tri: L'ordre dans lequel les fichiers dans Windows sont triés.

Par exemple, la liste suivante est naturellement triés (ce que je veux):

['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']

Et voici la "triés" version de la liste ci-dessus (ce que j'ai):

['Elm11', 'Elm12', 'Elm2', 'elm0', 'elm1', 'elm10', 'elm13', 'elm9']

Je suis à la recherche d'une fonction de tri qui se comporte comme le premier.

La définition d'un naturel tri n'est pas "l'ordre de Windows sortes de fichiers".
connexes: Python analogique de natsort fonction (tri d'une liste à l'aide d'un "ordre naturel" de l'algorithme)

InformationsquelleAutor snakile | 2011-01-29

189

Il y a un tiers de la bibliothèque pour cette sur PyPI appelé natsort (divulgation complète, je suis le package de l'auteur). Pour votre cas, vous pouvez effectuer une des opérations suivantes:
```
>>> from natsort import natsorted, ns
>>> x = ['Elm11', 'Elm12', 'Elm2', 'elm0', 'elm1', 'elm10', 'elm13', 'elm9']
>>> natsorted(x, key=lambda y: y.lower())
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
>>> natsorted(x, alg=ns.IGNORECASE)  # or alg=ns.IC
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
```
Vous devriez noter que natsort utilise un algorithme général, donc ça devrait marcher juste au sujet de toutes les suggestions que vous jeter à elle. Si vous souhaitez plus de détails sur pourquoi vous pouvez choisir une bibliothèque pour ce faire, plutôt que de rouler votre propre fonction, consultez la natsort de la documentation de Comment Ça Marche page, en particulier la Cas Particuliers Partout! section.

Si vous avez besoin d'une clé de tri au lieu d'une fonction de tri, utilisez l'une des ci-dessous les formules.
```
>>> from natsort import natsort_keygen, ns
>>> l1 = ['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
>>> l2 = l1[:]
>>> natsort_key1 = natsort_keygen(key=lambda y: y.lower())
>>> l1.sort(key=natsort_key1)
>>> l1
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
>>> natsort_key2 = natsort_keygen(alg=ns.IGNORECASE)
>>> l2.sort(key=natsort_key2)
>>> l2
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
```
- Je pense aussi que c'est très intéressant de noter que natsort trie également correct lorsque le nombre n'est pas à la fin: comme c'est souvent le cas pour les noms de fichiers. N'hésitez pas à inclure l'exemple suivant: pastebin.com/9cwCLdEK
InformationsquelleAutor SethMMorton
162

Essayez ceci:
```
import re

def natural_sort(l): 
    convert = lambda text: int(text) if text.isdigit() else text.lower() 
    alphanum_key = lambda key: [ convert(c) for c in re.split('([0-9]+)', key) ] 
    return sorted(l, key = alphanum_key)
```
De sortie:
```
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
```
Voir en ligne: ideone.

Code adapté à partir d'ici: De tri pour les êtres Humains : Naturel, l'Ordre de Tri.
- +1 Pourquoi les lambdas affectés à des noms?
- pourquoi utilisez-vous return sorted(l, key) au lieu de l.sort(key)? Est-ce pour tout gain de performances ou tout simplement pour être plus pythonic?
- Je pense que l'échelle permettrait de modifier la liste originale en l'appelant. Mais le plus probable de l'appelant veut d'une copie de la liste.
- Juste pour mémoire, il ne peut pas gérer toutes les entrées: le str/int divise doivent être en place, sinon, vous allez créer des comparaisons comme ["foo",0] < [0,"foo"] pour l'entrée ["foo0","0foo"], ce qui soulève une exception TypeError.
- En fait, il fonctionne, parce que re.split('([0-9]+)', '0foo') retourne ['', '0', 'foo']. À cause de cela, les chaînes seront toujours sur le même index et les entiers impairs index dans le tableau.
- Le ideone lien ne fonctionne plus
InformationsquelleAutor Mark Byers
84

Voici un beaucoup plus pythonic version de Marque Byer réponse:
```
import re

def natural_sort_key(s, _nsre=re.compile('([0-9]+)')):
    return [int(text) if text.isdigit() else text.lower()
            for text in _nsre.split(s)]    
```
Maintenant cette fonction peut être utilisé comme une clé dans une fonction qui l'utilise, comme list.sort, sorted, max, etc.

Comme un lambda:
```
lambda s: [int(t) if t.isdigit() else t.lower() for t in re.split('(\d+)', s)]
```
- Vous voudrez probablement précompiler le modèle que...
- module re compile et caches regexes automatiquement, donc il n'est pas nécessaire de précompiler
- il met en cache les X derniers usages, il est donc techniquement possible d'utiliser X+5 regexes et puis faire un naturel trier plus et plus, à quel point ce ne serait pas mis en cache. mais probablement négligeable sur le long terme
- Je ne l'ai pas, mais peut-être la raison en était qu'il ne peut pas gérer les tuples, comme un python de tri.
- Le X usages mentionnés par @Claudiu semblent être 100 sur Python 2.7 et 512 sur Python 3.4. Et notez également que lorsque la limite est atteinte, le cache est complètement effacé (il n'est donc pas seulement la plus ancienne qui est jeté).
- Pourquoi / Comment est-il judicieux de vider le cache complètement?
- J'ai juste mentionné que python est en train de faire à l'interne, peut-être il pourrait juste être la solution la plus simple. Vous pouvez lire plus sur ce problème ici: stackoverflow.com/q/17325281/11722
InformationsquelleAutor Claudiu

J'ai écrit une fonction sur la base http://www.codinghorror.com/blog/2007/12/sorting-for-humans-natural-sort-order.html qui ajoute la possibilité de toujours passer dans votre propre paramètre 'key'. J'ai besoin de ce dans le but d'effectuer un naturel de tri de listes qui contiennent des objets plus complexes (et pas seulement des chaînes de caractères).

import re

def natural_sort(list, key=lambda s:s):
    """
    Sort the list into natural alphanumeric order.
    """
    def get_alphanum_key_func(key):
        convert = lambda text: int(text) if text.isdigit() else text 
        return lambda s: [convert(c) for c in re.split('([0-9]+)', key(s))]
    sort_key = get_alphanum_key_func(key)
    list.sort(key=sort_key)

Par exemple:

my_list = [{'name':'b'}, {'name':'10'}, {'name':'a'}, {'name':'1'}, {'name':'9'}]
natural_sort(my_list, key=lambda x: x['name'])
print my_list
[{'name': '1'}, {'name': '9'}, {'name': '10'}, {'name': 'a'}, {'name': 'b'}]

un moyen plus simple de le faire est de définir natural_sort_key, puis lors du tri d'une liste que vous pourriez faire de la chaîne de vos clés, par exemple: list.sort(key=lambda el: natural_sort_key(el['name']))

InformationsquelleAutor beauburrier

15
```
data = ['elm13', 'elm9', 'elm0', 'elm1', 'Elm11', 'Elm2', 'elm10']
```
Nous allons analyser les données. Les chiffres de la capacité de tous les éléments est de 2. Et il y a 3 lettres en commun littérale partie 'elm'.

Donc, la longueur maximale de l'élément est de 5. On peut augmenter cette valeur pour s'assurer (par exemple, à 8).

Gardant cela à l'esprit, nous avons une solution en ligne:
```
data.sort(key=lambda x: '{0:0>8}'.format(x).lower())
```
sans expressions régulières et des bibliothèques externes!
```
print(data)

>>> ['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'elm13']
```
Explication:
```
for elm in data:
    print('{0:0>8}'.format(elm).lower())

>>>
0000elm0
0000elm1
0000elm2
0000elm9
000elm10
000elm11
000elm13
```
- Ce n'est pas la poignée de dynamique/longueur inconnue de données. Il trie également différemment que les autres solutions, pour les données dont les numéros dans l'opposition à la fin. *Ce n'est pas nécessairement indésirable, mais je pense qu'il est bon de souligner.
- Si vous devez gérer les dynamiques de données de longueur, vous pouvez utiliser width = max(data, key=len) de calculer des sous pour la 8 ci-dessus et ensuite les sous dans la chaîne de format avec '{0:0>{width}}'.format(x, width=width)
InformationsquelleAutor SergO
10

Donné:
```
data=['Elm11', 'Elm12', 'Elm2', 'elm0', 'elm1', 'elm10', 'elm13', 'elm9']
```
Similaire à Serge de solution, un 1-liner sans bibliothèques externes serait:
```
data.sort(key=lambda x : int(x[3:]))
```
ou
```
sorted_data=sorted(data, key=lambda x : int(x[3:]))
```
Explication:

Cette solution utilise le clé fonction de sorte de définir une fonction qui va être utilisé pour le tri. Parce que nous savons que chaque entrée est précédée par "l'orme" la fonction de tri convertit en entier la partie de la chaîne après la 3e personnage (c'est à dire de type int(x[3:])). Si la partie numérique de données est dans un emplacement différent, cette partie de la fonction serait de changer.

Acclamations

InformationsquelleAutor Camilo
5

Et maintenant pour quelque chose de plus* élégant (pythonic) -juste une touche

Il existe de nombreuses implémentations, et alors que certains sont proches, aucun bien capturé l'élégance moderne python offre.
- Testé à l'aide de python(3.5.1)
- Contient une liste supplémentaire de démontrer qu'il fonctionne lorsque le
  les numéros sont en milieu de chaîne
- N'ai pas fait de test, cependant, je suis en supposant que si votre liste est non négligeable, il serait plus efficace de compiler l'expression régulière à l'avance
  - Je suis sûr que quelqu'un va me corriger si c'est une supposition erronée
Rapidement
```
from re import compile, split    
dre = compile(r'(\d+)')
mylist.sort(key=lambda l: [int(s) if s.isdigit() else s.lower() for s in split(dre, l)])
```
Plein De Code
```
#!/usr/bin/python3
# coding=utf-8
"""
Natural-Sort Test
"""

from re import compile, split

dre = compile(r'(\d+)')
mylist = ['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13', 'elm']
mylist2 = ['e0lm', 'e1lm', 'E2lm', 'e9lm', 'e10lm', 'E12lm', 'e13lm', 'elm', 'e01lm']

mylist.sort(key=lambda l: [int(s) if s.isdigit() else s.lower() for s in split(dre, l)])
mylist2.sort(key=lambda l: [int(s) if s.isdigit() else s.lower() for s in split(dre, l)])

print(mylist)  
  # ['elm', 'elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
print(mylist2)  
  # ['e0lm', 'e1lm', 'e01lm', 'E2lm', 'e9lm', 'e10lm', 'E12lm', 'e13lm', 'elm']
```
Attention lors de l'utilisation de
- from os.path import split
  - vous aurez besoin de différencier les importations
Inspiration de
- La Documentation Python - Tri COMMENT
- De tri pour les êtres Humains : Naturel, l'Ordre de Tri
- L'Homme De Tri
- Contributeurs/Commentateurs de cette et les billets référencés
InformationsquelleAutor Jerod

Une option est de transformer la chaîne de caractères dans un n-uplet et remplacer des caractères à l'aide forme développée http://wiki.answers.com/Q/What_does_expanded_form_mean

de cette façon a90 deviendrait ("un",90,0) et a1 deviendrait ("a",1)

ci-dessous est un exemple de code (qui n'est pas très efficace en raison de la façon dont Elle supprime 0 de nombres)

alist=["something1",
    "something12",
    "something17",
    "something2",
    "something25and_then_33",
    "something25and_then_34",
    "something29",
    "beta1.1",
    "beta2.3.0",
    "beta2.33.1",
    "a001",
    "a2",
    "z002",
    "z1"]

def key(k):
    nums=set(list("0123456789"))
        chars=set(list(k))
    chars=chars-nums
    for i in range(len(k)):
        for c in chars:
            k=k.replace(c+"0",c)
    l=list(k)
    base=10
    j=0
    for i in range(len(l)-1,-1,-1):
        try:
            l[i]=int(l[i])*base**j
            j+=1
        except:
            j=0
    l=tuple(l)
    print l
    return l

print sorted(alist,key=key)

de sortie:

('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 1)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 10, 2)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 10, 7)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 2)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 20, 5, 'a', 'n', 'd', '_', 't', 'h', 'e', 'n', '_', 30, 3)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 20, 5, 'a', 'n', 'd', '_', 't', 'h', 'e', 'n', '_', 30, 4)
('s', 'o', 'm', 'e', 't', 'h', 'i', 'n', 'g', 20, 9)
('b', 'e', 't', 'a', 1, '.', 1)
('b', 'e', 't', 'a', 2, '.', 3, '.')
('b', 'e', 't', 'a', 2, '.', 30, 3, '.', 1)
('a', 1)
('a', 2)
('z', 2)
('z', 1)
['a001', 'a2', 'beta1.1', 'beta2.3.0', 'beta2.33.1', 'something1', 'something2', 'something12', 'something17', 'something25and_then_33', 'something25and_then_34', 'something29', 'z1', 'z002']

Malheureusement, cette solution ne fonctionne que pour Python 2.X. Pour Python 3, ('b', 1) < ('b', 'e', 't', 'a', 1, '.', 1) sera de retour TypeError: unorderable types: int() < str()

InformationsquelleAutor robert king

Sur la base des réponses ici, j'ai écrit un natural_sorted fonction qui se comporte comme la fonction intégrée sorted:

# Copyright (C) 2018, Benjamin Drung <[email protected]>
#
# Permission to use, copy, modify, and/or distribute this software for any
# purpose with or without fee is hereby granted, provided that the above
# copyright notice and this permission notice appear in all copies.
#
# THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
# WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
# MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
# ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
# WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
# ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
# OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
import re
def natural_sorted(iterable, key=None, reverse=False):
"""Return a new naturally sorted list from the items in *iterable*.
The returned list is in natural sort order. The string is ordered
lexicographically (using the Unicode code point number to order individual
characters), except that multi-digit numbers are ordered as a single
character.
Has two optional arguments which must be specified as keyword arguments.
*key* specifies a function of one argument that is used to extract a
comparison key from each list element: ``key=str.lower``.  The default value
is ``None`` (compare the elements directly).
*reverse* is a boolean value.  If set to ``True``, then the list elements are
sorted as if each comparison were reversed.
The :func:`natural_sorted` function is guaranteed to be stable. A sort is
stable if it guarantees not to change the relative order of elements that
compare equal --- this is helpful for sorting in multiple passes (for
example, sort by department, then by salary grade).
"""
prog = re.compile(r"(\d+)")
def alphanum_key(element):
"""Split given key in list of strings and digits"""
return [int(c) if c.isdigit() else c for c in prog.split(key(element)
if key else element)]
return sorted(iterable, key=alphanum_key, reverse=reverse)

Le code source est également disponible sur mon GitHub extraits du référentiel:
https://github.com/bdrung/snippets/blob/master/natural_sorted.py

InformationsquelleAutor Benjamin Drung

Valeur De Ce Post

Mon point est d'offrir à un non regex solution qui peut s'appliquer de manière générale.

Je vais créer trois fonctions:

find_first_digit qui j'ai emprunté de @AnuragUniyal. Il va trouver la position du premier chiffre ou non de chiffres dans une chaîne de caractères.
split_digits qui est un générateur qui prend en outre une chaîne en chiffres et non des chiffres morceaux. Il sera également yield des entiers quand c'est un chiffre.
natural_key juste enveloppements split_digits dans un tuple. C'est ce que nous utilisons comme une clé pour sorted, max, min.

Fonctions

def find_first_digit(s, non=False):
for i, x in enumerate(s):
if x.isdigit() ^ non:
return i
return -1
def split_digits(s, case=False):
non = True
while s:
i = find_first_digit(s, non)
if i == 0:
non = not non
elif i == -1:
yield int(s) if s.isdigit() else s if case else s.lower()
s = ''
else:
x, s = s[:i], s[i:]
yield int(x) if x.isdigit() else x if case else x.lower()
def natural_key(s, *args, **kwargs):
return tuple(split_digits(s, *args, **kwargs))

On peut voir que c'est général que nous pouvons avoir plusieurs chiffres morceaux:

# Note that the key has lower case letters
natural_key('asl;dkfDFKJ:sdlkfjdf809lkasdjfa_543_hh')
('asl;dkfdfkj:sdlkfjdf', 809, 'lkasdjfa_', 543, '_hh')

Ou laisser comme sensible à la casse:

natural_key('asl;dkfDFKJ:sdlkfjdf809lkasdjfa_543_hh', True)
('asl;dkfDFKJ:sdlkfjdf', 809, 'lkasdjfa_', 543, '_hh')

Nous pouvons voir qu'il trie les OP de la liste, dans l'ordre

sorted(
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13'],
key=natural_key
)
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']

Mais il peut gérer plus compliqué listes ainsi:

sorted(
['f_1', 'e_1', 'a_2', 'g_0', 'd_0_12:2', 'd_0_1_:2'],
key=natural_key
)
['a_2', 'd_0_1_:2', 'd_0_12:2', 'e_1', 'f_1', 'g_0']

Ma regex équivalent serait

def int_maybe(x):
return int(x) if str(x).isdigit() else x
def split_digits_re(s, case=False):
parts = re.findall('\d+|\D+', s)
if not case:
return map(int_maybe, (x.lower() for x in parts))
else:
return map(int_maybe, parts)
def natural_key_re(s, *args, **kwargs):
return tuple(split_digits_re(s, *args, **kwargs))

InformationsquelleAutor piRSquared

Les réponses ci-dessus sont bonnes pour la exemple précis qui a été montré, mais manquer plusieurs cas utiles pour la question plus générale de naturel de tri. Je viens de peu par l'un de ces cas, afin de créer une meilleure solution complète:

def natural_sort_key(string_or_number):
"""
by Scott S. Lawton <[email protected]> 2014-12-11; public domain and/or CC0 license
handles cases where simple 'int' approach fails, e.g.
['0.501', '0.55'] floating point with different number of significant digits
[0.01, 0.1, 1]    already numeric so regex and other string functions won't work (and aren't required)
['elm1', 'Elm2']  ASCII vs. letters (not case sensitive)
"""
def try_float(astring):
try:
return float(astring)
except:
return astring
if isinstance(string_or_number, basestring):
string_or_number = string_or_number.lower()
if len(re.findall('[.]\d', string_or_number)) <= 1:
# assume a floating point value, e.g. to correctly sort ['0.501', '0.55']
# '.' for decimal is locale-specific, e.g. correct for the Anglosphere and Asia but not continental Europe
return [try_float(s) for s in re.split(r'([\d.]+)', string_or_number)]
else:
# assume distinct fields, e.g. IP address, phone number with '.', etc.
# caveat: might want to first split by whitespace
# TBD: for unicode, replace isdigit with isdecimal
return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_or_number)]
else:
# consider: add code to recurse for lists/tuples and perhaps other iterables
return string_or_number

Le code de Test et plusieurs liens (sur et en dehors de StackOverflow) sont ici:
http://productarchitect.com/code/better-natural-sort.py

Commentaires de bienvenue. Ce n'est pas destiné à être une solution définitive; juste un pas en avant.

Dans votre script de test à laquelle vous lien, natsorted et humansorted échouent parce qu'ils ont été utilisés de manière incorrecte... vous avez essayé de passer natsorted comme une clé mais sa en fait la fonction de tri lui-même. Vous devriez avoir essayé natsort_keygen().

InformationsquelleAutor Scott Lawton

Plus susceptibles functools.cmp_to_key() est étroitement liée à l'implémentation sous-jacente de python de la sorte. En outre, la cmp paramètre est l'héritage. La façon moderne est de transformer des éléments d'entrée en objets qui prennent en charge l'souhaité riche d'opérations de comparaison.

En Vertu De Disponible 2.x, des objets de différents types peuvent être ordonnée même si le riche opérateurs de comparaison n'ont pas été mises en œuvre. En Vertu De Disponible 3.x, des objets de types différents devez explicitement de soutenir la comparaison. Voir Comment Python comparer string et int? qui relie le la documentation officielle. La plupart des réponses dépendent de l'implicite de la commande. De commutation pour Python 3.x nécessitera un nouveau type de mettre en œuvre et d'unifier les comparaisons entre les nombres et les chaînes de caractères.

Python 2.7.12 (default, Sep 29 2016, 13:30:34) 
>>> (0,"foo") < ("foo",0)
True

Python 3.5.2 (default, Oct 14 2016, 12:54:53) 
>>> (0,"foo") < ("foo",0)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: int() < str()

Il existe trois approches différentes. Le premier utilise des classes imbriquées à prendre avantage de Python Iterable de l'algorithme de comparaison. La deuxième se déroule cette imbrication dans une seule classe. La troisième renonce à sous-classement str de se concentrer sur la performance. Tous sont chronométrés; la seconde est deux fois plus rapide tandis que le troisième près de six fois plus. Sous-classement str n'est pas nécessaire, et était probablement une mauvaise idée en premier lieu, mais il ne viennent avec certaines convenances.

Le genre de personnages sont dupliqués à la force de la commande par cas, et le cas échangés à la force d'une lettre minuscule pour trier d'abord; c'est le cas typique de la définition de "naturel de tri". Je ne pouvais pas décider sur le type de groupement; certains préféreront peut-être la suivante, ce qui apporte également d'importants avantages de performance:

d = lambda s: s.lower()+s.swapcase()

S'il y a lieu, les opérateurs de comparaison sont à object donc ils ne seront pas être ignoré par functools.total_ordering.

import functools
import itertools
@functools.total_ordering
class NaturalStringA(str):
def __repr__(self):
return "{}({})".format\
( type(self).__name__
, super().__repr__()
)
d = lambda c, s: [ c.NaturalStringPart("".join(v))
for k,v in
itertools.groupby(s, c.isdigit)
]
d = classmethod(d)
@functools.total_ordering
class NaturalStringPart(str):
d = lambda s: "".join(c.lower()+c.swapcase() for c in s)
d = staticmethod(d)
def __lt__(self, other):
if not isinstance(self, type(other)):
return NotImplemented
try:
return int(self) < int(other)
except ValueError:
if self.isdigit():
return True
elif other.isdigit():
return False
else:
return self.d(self) < self.d(other)
def __eq__(self, other):
if not isinstance(self, type(other)):
return NotImplemented
try:
return int(self) == int(other)
except ValueError:
if self.isdigit() or other.isdigit():
return False
else:
return self.d(self) == self.d(other)
__le__ = object.__le__
__ne__ = object.__ne__
__gt__ = object.__gt__
__ge__ = object.__ge__
def __lt__(self, other):
return self.d(self) < self.d(other)
def __eq__(self, other):
return self.d(self) == self.d(other)
__le__ = object.__le__
__ne__ = object.__ne__
__gt__ = object.__gt__
__ge__ = object.__ge__

import functools
import itertools
@functools.total_ordering
class NaturalStringB(str):
def __repr__(self):
return "{}({})".format\
( type(self).__name__
, super().__repr__()
)
d = lambda s: "".join(c.lower()+c.swapcase() for c in s)
d = staticmethod(d)
def __lt__(self, other):
if not isinstance(self, type(other)):
return NotImplemented
groups = map(lambda i: itertools.groupby(i, type(self).isdigit), (self, other))
zipped = itertools.zip_longest(*groups)
for s,o in zipped:
if s is None:
return True
if o is None:
return False
s_k, s_v = s[0], "".join(s[1])
o_k, o_v = o[0], "".join(o[1])
if s_k and o_k:
s_v, o_v = int(s_v), int(o_v)
if s_v == o_v:
continue
return s_v < o_v
elif s_k:
return True
elif o_k:
return False
else:
s_v, o_v = self.d(s_v), self.d(o_v)
if s_v == o_v:
continue
return s_v < o_v
return False
def __eq__(self, other):
if not isinstance(self, type(other)):
return NotImplemented
groups = map(lambda i: itertools.groupby(i, type(self).isdigit), (self, other))
zipped = itertools.zip_longest(*groups)
for s,o in zipped:
if s is None or o is None:
return False
s_k, s_v = s[0], "".join(s[1])
o_k, o_v = o[0], "".join(o[1])
if s_k and o_k:
s_v, o_v = int(s_v), int(o_v)
if s_v == o_v:
continue
return False
elif s_k or o_k:
return False
else:
s_v, o_v = self.d(s_v), self.d(o_v)
if s_v == o_v:
continue
return False
return True
__le__ = object.__le__
__ne__ = object.__ne__
__gt__ = object.__gt__
__ge__ = object.__ge__

import functools
import itertools
import enum
class OrderingType(enum.Enum):
PerWordSwapCase         = lambda s: s.lower()+s.swapcase()
PerCharacterSwapCase    = lambda s: "".join(c.lower()+c.swapcase() for c in s)
class NaturalOrdering:
@classmethod
def by(cls, ordering):
def wrapper(string):
return cls(string, ordering)
return wrapper
def __init__(self, string, ordering=OrderingType.PerCharacterSwapCase):
self.string = string
self.groups = [ (k,int("".join(v)))
if k else
(k,ordering("".join(v)))
for k,v in
itertools.groupby(string, str.isdigit)
]
def __repr__(self):
return "{}({})".format\
( type(self).__name__
, self.string
)
def __lesser(self, other, default):
if not isinstance(self, type(other)):
return NotImplemented
for s,o in itertools.zip_longest(self.groups, other.groups):
if s is None:
return True
if o is None:
return False
s_k, s_v = s
o_k, o_v = o
if s_k and o_k:
if s_v == o_v:
continue
return s_v < o_v
elif s_k:
return True
elif o_k:
return False
else:
if s_v == o_v:
continue
return s_v < o_v
return default
def __lt__(self, other):
return self.__lesser(other, default=False)
def __le__(self, other):
return self.__lesser(other, default=True)
def __eq__(self, other):
if not isinstance(self, type(other)):
return NotImplemented
for s,o in itertools.zip_longest(self.groups, other.groups):
if s is None or o is None:
return False
s_k, s_v = s
o_k, o_v = o
if s_k and o_k:
if s_v == o_v:
continue
return False
elif s_k or o_k:
return False
else:
if s_v == o_v:
continue
return False
return True
# functools.total_ordering doesn't create single-call wrappers if both
# __le__ and __lt__ exist, so do it manually.
def __gt__(self, other):
op_result = self.__le__(other)
if op_result is NotImplemented:
return op_result
return not op_result
def __ge__(self, other):
op_result = self.__lt__(other)
if op_result is NotImplemented:
return op_result
return not op_result
# __ne__ is the only implied ordering relationship, it automatically
# delegates to __eq__

>>> import natsort
>>> import timeit
>>> l1 = ['Apple', 'corn', 'apPlE', 'arbour', 'Corn', 'Banana', 'apple', 'banana']
>>> l2 = list(map(str, range(30)))
>>> l3 = ["{} {}".format(x,y) for x in l1 for y in l2]
>>> print(timeit.timeit('sorted(l3+["0"], key=NaturalStringA)', number=10000, globals=globals()))
362.4729259099986
>>> print(timeit.timeit('sorted(l3+["0"], key=NaturalStringB)', number=10000, globals=globals()))
189.7340817489967
>>> print(timeit.timeit('sorted(l3+["0"], key=NaturalOrdering.by(OrderingType.PerCharacterSwapCase))', number=10000, globals=globals()))
69.34636392899847
>>> print(timeit.timeit('natsort.natsorted(l3+["0"], alg=natsort.ns.GROUPLETTERS | natsort.ns.LOWERCASEFIRST)', number=10000, globals=globals()))
98.2531585780016

Tri naturel est à la fois très compliqué et vaguement défini comme un problème. N'oubliez pas d'exécuter unicodedata.normalize(...) à l'avance, et envisager d'utiliser str.casefold() plutôt que str.lower(). Il y a probablement subtile problèmes d'encodage, je n'ai pas considéré. J'ai donc provisoirement recommander la natsort de la bibliothèque. J'ai pris un coup d'oeil rapide sur le dépôt github; le code de la maintenance a été stellaire.

Tous les algorithmes que j'ai vu dépendent des astuces telles que la duplication et l'abaissement des caractères, et d'échanger sur les cas. Tout cela double le temps d'exécution, une autre solution nécessiterait un total de l'ordre naturel à l'entrée du jeu de caractères. Je ne pense pas que ce est une partie de la spécification unicode, et depuis il y a beaucoup plus d'unicode chiffres que [0-9], la création d'un tel tri serait tout aussi redoutable. Si vous voulez locale-connaissance des comparaisons, préparez vos cordes avec paramètres régionaux.strxfrm par Python Tri COMMENT.

InformationsquelleAutor user19087

0

Je vous suggère de simplement utiliser le key argument mot-clé de sorted à atteindre vos liste

Par exemple:
```
to_order= [e2,E1,e5,E4,e3]
ordered= sorted(to_order, key= lambda x: x.lower())
# ordered should be [E1,e2,e3,E4,e5]
```
InformationsquelleAutor Johny Vaknin

a = ['H1', 'H100', 'H10', 'H3', 'H2', 'H6', 'H11', 'H50', 'H5', 'H99', 'H8']
b = ''
c = []
def bubble(bad_list):#bubble sort method
length = len(bad_list) - 1
sorted = False
while not sorted:
sorted = True
for i in range(length):
if bad_list[i] > bad_list[i+1]:
sorted = False
bad_list[i], bad_list[i+1] = bad_list[i+1], bad_list[i] #sort the integer list 
a[i], a[i+1] = a[i+1], a[i] #sort the main list based on the integer list index value
for a_string in a: #extract the number in the string character by character
for letter in a_string:
if letter.isdigit():
#print letter
b += letter
c.append(b)
b = ''
print 'Before sorting....'
print a
c = map(int, c) #converting string list into number list
print c
bubble(c)
print 'After sorting....'
print c
print a

Remerciements:

Tri À Bulles Devoirs

Comment lire une chaîne de caractères une lettre à la fois en python

InformationsquelleAutor Varadaraju G

-2
```
>>> import re
>>> sorted(lst, key=lambda x: int(re.findall(r'\d+$', x)[0]))
['elm0', 'elm1', 'Elm2', 'elm9', 'elm10', 'Elm11', 'Elm12', 'elm13']
```
- Pouvez-vous expliquer le re partie?
- les matchs de chiffres à la fin de la chaîne.
- href="http://docs.python.org/library/re.html" >docs.python.org/library/re.html
- Votre seulement la mise en œuvre résout les numéros de problème. La mise en oeuvre échoue si les chaînes n'ont pas de numéros en eux. Essayez-le sur ['silencieuse','ghost'] par exemple (list index out of range).
- votre question ne parvient pas à fournir décent exemple de cas. Vous n'avez pas expliqué ce que vous êtes en train de faire, et ni vous avez mis à jour votre question avec cette nouvelle information. Vous n'avez pas posté quelque chose que vous avez essayé, merci donc de ne pas être écarté de ma télépathie tentative.
- Tout d'abord, je vous ai donné un upvote parce que je pense que votre réponse est utile (même si ça ne résout pas mon problème). Deuxièmement, je ne peut pas couvrir tous les cas possibles avec des exemples. Je pense que j'ai donné assez clair définition naturelle de tri. Je ne pense pas que c'est une bonne idée pour donner un exemple complexe ou une longue définition d'un concept tellement simple. Vous êtes les bienvenus pour modifier ma question, si vous pouvez penser à une meilleure formulation pour le problème.
- mais je ne sais pas comment faire pour améliorer votre question, parce que pour moi c'est pas clair du tout comment vous voulez traiter avec des chaînes qui n'ont pas de chiffres, mais ils ont d'autres cas, les longueurs, etc.
- Je veux faire face à de tels chaînes de la même façon dont Windows traite de ce type de noms de fichiers quand il trie les fichiers par nom (ignorer les cas, etc). Il me semble clair, mais ce que je dis me semble clair, donc je ne suis pas à juger si c'est clair ou pas.
- vous êtes venus nulle part près de près de définir le référencement naturel. Qui serait assez difficile et nécessiterait beaucoup de détails. Si vous voulez que l'ordre de tri utilisé par l'explorateur windows, savez-vous qu'il y a un simple appel d'api qui fournit?
InformationsquelleAutor SilentGhost

Vous devez vous connecter pour publier un commentaire.