Lire un fichier dans l'ordre inverse à l'aide de python

Comment lire un fichier dans l'ordre inverse à l'aide de python? Je veux lire un fichier à partir de la dernière ligne à la première ligne.

Voulez-vous dire "à lire dans l'ordre inverse" ou "processus les lignes dans l'ordre inverse"? Il y a une différence. Avec la première, potentiellement le fichier ne s'inscrirait pas dans la mémoire de tous en même temps, si vous voulez traiter les lignes dans l'ordre inverse, mais vous ne pouvez pas lire l'intégralité du fichier et l'inverser. Avec le second, vous pourriez lire l'intégralité du fichier, et d'inverser la liste des lignes avant de les traiter. Alors, qui est-il?
Voir aussi: Obtenir les n dernières lignes d'un fichier avec Python, semblable à la queue
Je recommande ce-pas de problèmes de mémoire et rapide: stackoverflow.com/a/260433/1212562

InformationsquelleAutor Nimmy | 2010-02-20

69
```
for line in reversed(open("filename").readlines()):
    print line.rstrip()
```
Et en Python 3:
```
for line in reversed(list(open("filename"))):
    print(line.rstrip())
```
- Hélas, cela ne fonctionne pas si vous ne pouvez pas répondre à tout le fichier en mémoire.
- Posté le Python 3 méthode ne fonctionne pas (bien que je souhaite c'était le cas).
- Aussi, alors que le posté code n'répondre à la question, il faut être attentif à la fermeture des dossiers que nous avons ouvert. Le with instruction est généralement tout à fait indolore.
- Toutes les réponses exigent que la totalité du fichier est lu en mémoire. Est-il possible d'utiliser un itérateur de la fonction suivante (à l'envers?
- Pas sans lire l'original itérateur dans la mémoire d'abord, puis la présentation d'un nouveau itérateur sur le premier dans le sens inverse.
- Vous pouvez lire un fichier en sens inverse sans le lire dans la mémoire, mais il est non trivial et nécessite beaucoup de mémoire tampon de manigances pour éviter considérable système d'appel des déchets. Il va également effectuer très mal (bien mieux que la lecture de l'ensemble de la mémoire en mémoire si le fichier dépasse la mémoire disponible).
- Désolé, comment puis-je utiliser la solution ci-dessus à l'aide de "ouverts", tandis que de parcourir le fichier et ensuite le nettoyage de la fermer?
- En supposant que les fichiers seront toujours tenir en mémoire n'est pas une bonne solution et ne devrait pas être accepté ou canonique. @MattJoiner: être évolutive n'est pas un "cas de coin".
- A voté vers le bas. Cette réponse a un peu de pas-si-bien-pensée choses: le moulage d'un TextIOWrapper poignée droit à une liste sans la fermer et l'épuiser entièrement en mémoire, de faire une inversion de phase avec la mémoire (lorsqu'il n'est pas nécessaire, l'autre réponse ne lit que vers l'arrière à partir du disque), puis la sortie dépouillé lignes.
- Mais ce qui est mal à propos de l'inversion de +10 GO de fichiers en mémoire? La première: vous ne pouvez pas avoir assez de mémoire pour juste de copier l'intégralité du fichier, la seconde: il est plus lent que de simplement lire à l'envers, et le troisième: il gaspille de l'espace mémoire à partir d'autres processus et Python peut même obtenir des OOM-tués de cette façon. Tout simplement vraiment de la lecture du fichier vers l'arrière sans la copie de fichier entièrement à l'intérieur de la mémoire des échelles bien qu'il n'a pas de limite de mémoire par taille de fichier, et c'est aussi rapide que la lecture normalement.
InformationsquelleAutor Matt Joiner
134

Une bonne, réponse efficace à l'écrit comme un générateur.
```
import os

def reverse_readline(filename, buf_size=8192):
    """A generator that returns the lines of a file in reverse order"""
    with open(filename) as fh:
        segment = None
        offset = 0
        fh.seek(0, os.SEEK_END)
        file_size = remaining_size = fh.tell()
        while remaining_size > 0:
            offset = min(file_size, offset + buf_size)
            fh.seek(file_size - offset)
            buffer = fh.read(min(remaining_size, buf_size))
            remaining_size -= buf_size
            lines = buffer.split('\n')
            # The first line of the buffer is probably not a complete line so
            # we'll save it and append it to the last line of the next buffer
            # we read
            if segment is not None:
                # If the previous chunk starts right from the beginning of line
                # do not concat the segment to the last line of new chunk.
                # Instead, yield the segment first 
                if buffer[-1] != '\n':
                    lines[-1] += segment
                else:
                    yield segment
            segment = lines[0]
            for index in range(len(lines) - 1, 0, -1):
                if lines[index]:
                    yield lines[index]
        # Don't yield None if the file was empty
        if segment is not None:
            yield segment
```
- Cela ne fonctionnera pas pour texte fichiers en python>=3.2, depuis quelques raison cherche par rapport à la fin du fichier n'est plus pris en charge. Peut être fixé par le gain de la taille de fichier renvoyé par fh.seek(0, os.SEEK_END) et la modification de la fh.seek(-offset, os.SEEK_END) trop fh.seek(file_size - offset).
- Après les modifications apportées, cela fonctionne parfaitement en python 3.5. Meilleure réponse à la question.
- revenir cette modification pour python 2 où fh.seek() retourne None
- Attention à ce que cela peut ne pas fonctionner comme prévu pour les fichiers texte. Se bloque correctement dans l'ordre inverse ne fonctionne que pour les fichiers binaires. Le problème, c'est que pour les fichiers texte avec un encodage multi-octet (comme utf8), seek() et read() se référer à différentes tailles. C'est probablement aussi la raison pour laquelle les non-zéro premier argument de seek() par rapport à os.SEEK_END n'est pas pris en charge.
- pouvez-vous veuillez donner des précisions & fournir un exemple simple quand on va à l'échec?
- simple: 'aöaö'.encode() est b'a\xc3\xb6a\xc3\xb6'. Si vous pouvez l'enregistrer sur le disque puis de les lire en mode texte, lorsque vous ne seek(2) il va se déplacer par deux octets, de sorte que seek(2); read(1) entraînera une erreur de UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb6 in position 0: invalid start byte, mais si vous ne seek(0); read(2); read(1), vous obtiendrez la 'a' que vous attendiez, c'est: seek() n'est jamais encodage de la conscience, read() est si vous ouvrez le fichier en mode texte. Maintenant, si vous avez 'aöaö' * 1000000, vos blocs ne seront pas alignés correctement.
- Comme une note de côté, ceci est mis en œuvre dans un encodage-courant de la mode dans le flyingcircus package (flyingcircus.util.readline(reverse=True)). Avertissement: je suis l'auteur du paquet.
InformationsquelleAutor srohde

Comment quelque chose comme cela:

import os


def readlines_reverse(filename):
    with open(filename) as qfile:
        qfile.seek(0, os.SEEK_END)
        position = qfile.tell()
        line = ''
        while position >= 0:
            qfile.seek(position)
            next_char = qfile.read(1)
            if next_char == "\n":
                yield line[::-1]
                line = ''
            else:
                line += next_char
            position -= 1
        yield line[::-1]


if __name__ == '__main__':
    for qline in readlines_reverse(raw_input()):
        print qline

Depuis le fichier est en lecture caractère par caractère dans l'ordre inverse, il fonctionnera même sur de très gros fichiers, tant que les lignes individuelles tenir en mémoire.

InformationsquelleAutor Berislav Lopac

18

Vous pouvez également utiliser le module python file_read_backwards.

Après l'installation, via pip install file_read_backwards (v1.2.1), vous pouvez lire l'intégralité du fichier vers l'arrière (en ligne-sage), dans une mémoire de manière efficace par le biais de:
```
#!/usr/bin/env python2.7

from file_read_backwards import FileReadBackwards

with FileReadBackwards("/path/to/file", encoding="utf-8") as frb:
    for l in frb:
         print l
```
Il prend en charge "utf-8","latin-1", et "ascii" encodages.

Est également disponible pour python3. La documentation complémentaire peut être trouvé à http://file-read-backwards.readthedocs.io/en/latest/readme.html
- Merci pour cette solution. J'aime (et aussi upvoted) la solution ci-dessus par @srohde car il m'a aidé à comprendre comment c'est fait, mais en tant que développeur, je préfère utiliser un module existant quand je peux, donc je suis heureux de savoir à ce sujet.
- Cela fonctionne avec encodage multi-octets comme de l'UTF-8. La recherche/lecture solution n'a pas d': seek() compte en octets, read() en caractères.
InformationsquelleAutor user7321751
8
```
for line in reversed(open("file").readlines()):
    print line.rstrip()
```
Si vous êtes sous linux, vous pouvez utiliser tac commande.
```
$ tac file
```
2 recettes que vous pouvez trouver dans ActiveState ici et ici
- Je me demande s'il est inversé() consomme de l'ensemble de la séquence avant d'itération. Docs dire un __reversed__() méthode est nécessaire, mais python2.5 ne pas se plaindre d'une classe personnalisée sans elle.
- il a probablement à mettre en cache en en quelque sorte, je pense qu'elle génère une nouvelle liste dans l'ordre inverse, puis retourne un itérateur pour que
- ce serait ridicule. Il va tout simplement de l'arrière à l'avant-- len(L)-1 est le dos, 0 est l'avant. Vous pouvez imaginer le reste.
- Les séquences ne sont pas véritablement consommée (vous pouvez effectuer une itération sur l'ensemble de la séquence, mais il n'a pas d'importance très bien). Un __reversed__ méthode est également pas nécessaire, et il n'a pas une telle chose. Si un objet permet d' __len__ et __getitem__ il fonctionne très bien (moins quelques cas exceptionnels, comme dict).
- Jean-pierre: Seulement si readlines() renvoie un objet qui fournit __reversed__?
- Elle retourne une liste. De toute façon, si un objet permet juste __len__ et __getitem__, il fonctionne exactement comme décrit (par exemple: codepad.org/aglIbcXy ). Listes de travail comme décrit (voir la définition de list_reverse (__reversed__) à svn.python.org/view/python/trunk/Objects/... ).
- Puis ma déclaration d'origine est correcte. Le dossier complet doit être lu avant que la liste ne peut être réitéré dans l'ordre inverse.
- L'original de votre déclaration n'est pas exactement ce que j'appellerais correct (ou si c'était exact, je n'ai pas le lire comme prévu). Il serait de lire l'intégralité du fichier, indépendamment de savoir si reversed() est appelé sur elle, parce que c'est ce que readlines() n'. il ne construit pas la liste dans l'ordre inverse, c'est plutôt elle crée un itérateur qui itère sur la liste (dans l'ordre), vers l'arrière.
- En effet, je pense que nous sommes tous les deux d'accord avec le comportement ici (et que ce n'est pas idéal): readlines() génère une liste, immédiatement (par la lecture de l'ensemble du fichier). inversé() n'a pas d'générer la liste inversée immédiatement, plutôt, il crée un itérateur à l'aide de len et getitem. enfin, l'inversion de l'opérateur peut être fourni pour les objets de Fichier, ou readlines() retvars, qui fait de lire le fichier à partir de l'arrière vers l'avant, mais il n'est pas le cas actuellement, et peut-être même pas l'idéal.
- Mais si readlines() retournait un itérateur avec une bonne __reversed__() ce serait cool. En fait, les deux réponses à l'aide de readlines() sont horriblement inefficace pour les gros fichiers.
- J'ai utiliser des itérateurs absolument partout possible: Ici, ils ne sont pas possible (sauf pour itérer readlines dans le sens inverse), mais sinon, vous pouvez simplement utiliser for line in open("file")
InformationsquelleAutor ghostdog74
8
```
import re

def filerev(somefile, buffer=0x20000):
  somefile.seek(0, os.SEEK_END)
  size = somefile.tell()
  lines = ['']
  rem = size % buffer
  pos = max(0, (size // buffer - 1) * buffer)
  while pos >= 0:
    somefile.seek(pos, os.SEEK_SET)
    data = somefile.read(rem + buffer) + lines[0]
    rem = 0
    lines = re.findall('[^\n]*\n?', data)
    ix = len(lines) - 2
    while ix > 0:
      yield lines[ix]
      ix -= 1
    pos -= buffer
  else:
    yield lines[0]

with open(sys.argv[1], 'r') as f:
  for line in filerev(f):
    sys.stdout.write(line)
```
- Cela semble produire de la mauvaise sortie pour les fichiers de plus de mémoire tampon. Il ne sera pas gérer correctement les lignes qui s'étendent sur le tampon-morceaux de taille vous lisez, ce que je comprends. J'ai posté un autre type de réponse (à une autre question similaire).
- Ah oui, j'ai l'impression d'avoir manqué un peu. Devrait être corrigé maintenant.
- Regarde, à droite. Je préfère encore mon propre code, parce que ce n'est O(N^2) travailler sur un fichier, c'est tout un long de ligne. (Dans le même genre de réponses à la question que j'ai testé, ce qui a provoqué une grave véritable ralentissement sur ces fichiers.)
- Ainsi la question de ne pas mentionner la performance, donc je ne peux pas pinaille sur la performance catastrophe qui est des expressions régulières 😛
- Certains plus d'explication serait utile que les performances et si cela peut effectivement chercher à disons que la dernière ligne et de lire que seule pièce.
InformationsquelleAutor Ignacio Vazquez-Abrams

Ici vous pouvez trouver mon application, vous pouvez limiter l'utilisation de la ram en changeant le "tampon" de la variable, il y a un bug que le programme affiche une ligne vide au début.

Et aussi l'utilisation de la ram peut être augmenter si il n'y a pas de nouvelles lignes pour plus d'octets de la mémoire tampon, "fuite" variable augmente jusqu'à voir une nouvelle ligne ("\n").

C'est aussi en travaillant pour 16 GO de fichiers qui est plus grande que ma mémoire totale.

import os,sys
buffer = 1024*1024 # 1MB
f = open(sys.argv[1])
f.seek(0, os.SEEK_END)
filesize = f.tell()

division, remainder = divmod(filesize, buffer)
line_leak=''

for chunk_counter in range(1,division + 2):
    if division - chunk_counter < 0:
        f.seek(0, os.SEEK_SET)
        chunk = f.read(remainder)
    elif division - chunk_counter >= 0:
        f.seek(-(buffer*chunk_counter), os.SEEK_END)
        chunk = f.read(buffer)

    chunk_lines_reversed = list(reversed(chunk.split('\n')))
    if line_leak: # add line_leak from previous chunk to beginning
        chunk_lines_reversed[0] += line_leak

    # after reversed, save the leakedline for next chunk iteration
    line_leak = chunk_lines_reversed.pop()

    if chunk_lines_reversed:
        print "\n".join(chunk_lines_reversed)
    # print the last leaked line
    if division - chunk_counter < 0:
        print line_leak

InformationsquelleAutor Bekir Dogan

Merci pour la réponse @srohde. Il a un petit bug vérification de caractère de saut de ligne avec " est " de l'opérateur, et je ne pouvais pas commenter la réponse avec 1 réputation. Je tiens aussi à gérer un fichier ouvert à l'extérieur, car cela me permet d'intégrer mes divagations pour luigi tâches.

Ce que j'avais besoin de changer est de la forme:

with open(filename) as fp:
    for line in fp:
        #print line,  # contains new line
        print '>{}<'.format(line)

J'aimerais changer pour:

with open(filename) as fp:
    for line in reversed_fp_iter(fp, 4):
        #print line,  # contains new line
        print '>{}<'.format(line)

Ici est une modification de la réponse qui se veut un descripteur de fichier et de garde des retours à la ligne:

def reversed_fp_iter(fp, buf_size=8192):
    """a generator that returns the lines of a file in reverse order
    ref: https://stackoverflow.com/a/23646049/8776239
    """
    segment = None  # holds possible incomplete segment at the beginning of the buffer
    offset = 0
    fp.seek(0, os.SEEK_END)
    file_size = remaining_size = fp.tell()
    while remaining_size > 0:
        offset = min(file_size, offset + buf_size)
        fp.seek(file_size - offset)
        buffer = fp.read(min(remaining_size, buf_size))
        remaining_size -= buf_size
        lines = buffer.splitlines(True)
        # the first line of the buffer is probably not a complete line so
        # we'll save it and append it to the last line of the next buffer
        # we read
        if segment is not None:
            # if the previous chunk starts right from the beginning of line
            # do not concat the segment to the last line of new chunk
            # instead, yield the segment first
            if buffer[-1] == '\n':
                #print 'buffer ends with newline'
                yield segment
            else:
                lines[-1] += segment
                #print 'enlarged last line to >{}<, len {}'.format(lines[-1], len(lines))
        segment = lines[0]
        for index in range(len(lines) - 1, 0, -1):
            if len(lines[index]):
                yield lines[index]
    # Don't yield None if the file was empty
    if segment is not None:
        yield segment

InformationsquelleAutor Murat Yükselen

2

une fonction simple pour créer un deuxième fichier inversé (linux uniquement):
```
import os
def tac(file1, file2):
     print(os.system('tac %s > %s' % (file1,file2)))
```
comment utiliser
```
tac('ordered.csv', 'reversed.csv')
f = open('reversed.csv')
```
- Je pense que l'objectif était de savoir comment le faire en Python. De Plus, cela ne fonctionne que sur les systèmes *Nix, bien que c'est une excellente solution pour cela. C'est essentiellement à l'aide de Python comme une invite à exécuter des utilitaires d'environnement.
- Ce code a d'importantes failles de sécurité tel qu'il est actuellement rédigé. Que faire si vous êtes tenté d'inverser un fichier créé avec mv mycontent.txt $'hello $(rm -rf $HOME) world.txt', ou même en utilisant un nom de fichier de sortie donnée par un utilisateur non fiable? Si vous souhaitez gérer l'arbitraire des noms de fichiers en toute sécurité, il faut plus de prudence. subprocess.Popen(['tac', file1], stdout=open(file2, 'w')) serait à l'abri, par exemple.
- Le code existant n'a pas également de gérer correctement les fichiers avec des espaces, des caractères génériques, &c.
InformationsquelleAutor Alexandre Andrade

Accepté de répondre ne fonctionne pas pour les cas avec de gros fichiers qui ne tiennent pas en mémoire (ce qui n'est pas un cas rare).

Comme il a été noté par les autres, @srohde répondre semble bon, mais il a prochaines questions:

ouverture de fichier semble redondant, quand on peut passer de l'objet fichier & laisser à l'utilisateur de décider dans quel encodage il faut le lire,
même si nous refactoriser à accepter de fichier de l'objet, il ne fonctionnera pas pour tous les encodages: on peut choisir fichier avec utf-8 d'encodage et de non-ascii contenu comme
```
й
```
passer buf_size égal à 1 et aura
```
UnicodeDecodeError: 'utf8' codec can't decode byte 0xb9 in position 0: invalid start byte
```
bien sûr, le texte peut être plus grande, mais buf_size peut être ramassé, donc il va conduire à d'obfuscation d'erreur comme ci-dessus,
nous ne pouvons préciser la coutume de séparateur de ligne,
nous ne pouvons pas choisir de garder séparateur de ligne.

Si l'on considère l'ensemble de ces préoccupations que j'ai écrit des fonctions distinctes:

qui fonctionne avec l'octet de ruisseaux, de
second qui fonctionne avec du texte des ruisseaux et des délégués de la sous-jacentes de ses flux d'octets à la première et décode les lignes résultantes.

Tout d'abord nous allons définir ensuite les fonctions de l'utilitaire:

ceil_division pour la fabrication de division avec le plafond (en contraste avec la norme // division avec le plancher, plus d'informations peuvent être trouvées dans ce fil)

def ceil_division(left_number, right_number):
    """
    Divides given numbers with ceiling.
    """
    return -(-left_number // right_number)

split pour le fractionnement de la chaîne par le séparateur d'extrémité droite avec la possibilité de le garder:

def split(string, separator, keep_separator):
    """
    Splits given string by given separator.
    """
    parts = string.split(separator)
    if keep_separator:
        *parts, last_part = parts
        parts = [part + separator for part in parts]
        if last_part:
            return parts + [last_part]
    return parts

read_batch_from_end pour le lot de lecture à partir de l'extrémité droite de flux binaire

def read_batch_from_end(byte_stream, size, end_position):
    """
    Reads batch from the end of given byte stream.
    """
    if end_position > size:
        offset = end_position - size
    else:
        offset = 0
        size = end_position
    byte_stream.seek(offset)
    return byte_stream.read(size)

Après cela, nous pouvons définir la fonction de lecture de flux d'octets dans l'ordre inverse comme

import functools
import itertools
import os
from operator import methodcaller, sub
def reverse_binary_stream(byte_stream, batch_size=None,
lines_separator=None,
keep_lines_separator=True):
if lines_separator is None:
lines_separator = (b'\r', b'\n', b'\r\n')
lines_splitter = methodcaller(str.splitlines.__name__,
keep_lines_separator)
else:
lines_splitter = functools.partial(split,
separator=lines_separator,
keep_separator=keep_lines_separator)
stream_size = object_.seek(0, os.SEEK_END)
if batch_size is None:
batch_size = stream_size or 1
batches_count = ceil_division(stream_size, batch_size)
remaining_bytes_indicator = itertools.islice(
itertools.accumulate(itertools.chain([stream_size],
itertools.repeat(batch_size)),
sub),
batches_count)
try:
remaining_bytes_count = next(remaining_bytes_indicator)
except StopIteration:
return
def read_batch(position: int) -> bytes:
result = read_batch_from_end(object_,
size=batch_size,
end_position=position)
while result.startswith(lines_separator):
try:
position = next(remaining_bytes_indicator)
except StopIteration:
break
result = (read_batch_from_end(object_,
size=batch_size,
end_position=position)
+ result)
return result
batch = read_batch(remaining_bytes_count)
segment, *lines = lines_splitter(batch)
yield from reverse(lines)
for remaining_bytes_count in remaining_bytes_indicator:
batch = read_batch(remaining_bytes_count)
lines = lines_splitter(batch)
if batch.endswith(lines_separator):
yield segment
else:
lines[-1] += segment
segment, *lines = lines
yield from reverse(lines)
yield segment

et enfin une fonction d'inversion de fichier texte peut être défini comme:

import codecs
def reverse_file(file, batch_size=None, 
lines_separator=None,
keep_lines_separator=True):
encoding = file.encoding
if lines_separator is not None:
lines_separator = lines_separator.encode(encoding)
yield from map(functools.partial(codecs.decode,
encoding=encoding),
reverse_binary_stream(
file.buffer,
batch_size=batch_size,
lines_separator=lines_separator,
keep_lines_separator=keep_lines_separator))

Tests

Préparations

J'ai généré 4 fichiers à l'aide de fsutil commande:

empty.txt sans contenu, la taille 0MB
tiny.txt avec une taille de 1 MO
small.txt avec une taille de 10 MO
large.txt avec une taille de 50 MO

aussi j'ai refait @srohde solution pour travailler avec des fichiers objet au lieu de le chemin d'accès au fichier.

Script de Test

from timeit import Timer
repeats_count = 7
number = 1
create_setup = ('from collections import deque\n'
'from __main__ import reverse_file, reverse_readline\n'
'file = open("{}")').format
srohde_solution = ('with file:\n'
'    deque(reverse_readline(file,\n'
'                           buf_size=8192),'
'          maxlen=0)')
azat_ibrakov_solution = ('with file:\n'
'    deque(reverse_file(file,\n'
'                       lines_separator="\\n",\n'
'                       keep_lines_separator=False,\n'
'                       batch_size=8192), maxlen=0)')
print('reversing empty file by "srohde"',
min(Timer(srohde_solution,
create_setup('empty.txt')).repeat(repeats_count, number)))
print('reversing empty file by "Azat Ibrakov"',
min(Timer(azat_ibrakov_solution,
create_setup('empty.txt')).repeat(repeats_count, number)))
print('reversing tiny file (1MB) by "srohde"',
min(Timer(srohde_solution,
create_setup('tiny.txt')).repeat(repeats_count, number)))
print('reversing tiny file (1MB) by "Azat Ibrakov"',
min(Timer(azat_ibrakov_solution,
create_setup('tiny.txt')).repeat(repeats_count, number)))
print('reversing small file (10MB) by "srohde"',
min(Timer(srohde_solution,
create_setup('small.txt')).repeat(repeats_count, number)))
print('reversing small file (10MB) by "Azat Ibrakov"',
min(Timer(azat_ibrakov_solution,
create_setup('small.txt')).repeat(repeats_count, number)))
print('reversing large file (50MB) by "srohde"',
min(Timer(srohde_solution,
create_setup('large.txt')).repeat(repeats_count, number)))
print('reversing large file (50MB) by "Azat Ibrakov"',
min(Timer(azat_ibrakov_solution,
create_setup('large.txt')).repeat(repeats_count, number)))

Note: j'ai utilisé collections.deque classe d'échappement de la génératrice.

Sorties

Pour PyPy 3.5 sur Windows 10:

reversing empty file by "srohde" 8.31e-05
reversing empty file by "Azat Ibrakov" 0.00016090000000000028
reversing tiny file (1MB) by "srohde" 0.160081
reversing tiny file (1MB) by "Azat Ibrakov" 0.09594989999999998
reversing small file (10MB) by "srohde" 8.8891863
reversing small file (10MB) by "Azat Ibrakov" 5.323388100000001
reversing large file (50MB) by "srohde" 186.5338368
reversing large file (50MB) by "Azat Ibrakov" 99.07450229999998

Pour Disponible 3.5 sur Windows 10:

reversing empty file by "srohde" 3.600000000000001e-05
reversing empty file by "Azat Ibrakov" 4.519999999999958e-05
reversing tiny file (1MB) by "srohde" 0.01965560000000001
reversing tiny file (1MB) by "Azat Ibrakov" 0.019207699999999994
reversing small file (10MB) by "srohde" 3.1341862999999996
reversing small file (10MB) by "Azat Ibrakov" 3.0872588000000007
reversing large file (50MB) by "srohde" 82.01206720000002
reversing large file (50MB) by "Azat Ibrakov" 82.16775059999998

Ainsi, comme nous pouvons le voir se comporte comme solution originale, mais elle est plus générale et sans ses inconvénients énumérés ci-dessus.

Annonce

J'ai ajouté ceci à 0.3.0 version de lz le paquet (nécessite Python 3.5+) qui ont bien testé fonctionnel/itération utilitaires.

Peut être utilisé comme

 import io
from lz.iterating import reverse
...
with open('path/to/file') as file:
for line in reverse(file, batch_size=io.DEFAULT_BUFFER_SIZE):
print(line)

Il prend en charge tous les encodages standard (peut-être à l'exception de utf-7 car il est difficile pour moi de définir une stratégie pour générer des chaînes de encodable avec elle).

InformationsquelleAutor Azat Ibrakov

1

Si vous êtes inquiet au sujet de la taille du fichier /utilisation de la mémoire, de la mémoire-la cartographie du fichier et la numérisation vers l'arrière pour les retours à la ligne est une solution:

Comment rechercher une chaîne de caractères dans des fichiers texte?

InformationsquelleAutor Federico
1

avec open("filename") comme f:
```
    print(f.read()[::-1])
```
InformationsquelleAutor JackoM

def reverse_lines(filename):
y=open(filename).readlines()
return y[::-1]

InformationsquelleAutor Gareema

Toujours utiliser with lorsque vous travaillez avec des fichiers comme il s'occupe de tout pour vous:

with open('filename', 'r') as f:
for line in reversed(f.readlines()):
print line

Ou en Python 3:

with open('filename', 'r') as f:
for line in reversed(list(f.readlines())):
print(line)

InformationsquelleAutor Carlos Afonso

0

vous devez d'abord ouvrir votre fichier en lecture format, l'enregistrer dans une variable, puis ouvrez le deuxième fichier au format écrit où vous pouvez écrire ou ajouter la variable à l'aide d'un l' [::-1] tranche, renversant complètement le fichier. Vous pouvez également utiliser readlines() pour faire une liste de lignes, vous pouvez manipuler
```
def copy_and_reverse(filename, newfile):
with open(filename) as file:
text = file.read()
with open(newfile, "w") as file2:
file2.write(text[::-1])
```
InformationsquelleAutor PawlakJ

La plupart des réponses ont besoin de lire le fichier en entier avant de faire quoi que ce soit. Cet exemple lit de plus en plus de grands échantillons à partir de la fin.

Je n'ai vu Murat Yükselen de réponse lors de l'écriture de cette réponse. C'est presque le même, qui, je suppose, est une bonne chose. L'exemple ci-dessous traite aussi avec \r et augmente sa taille de tampon à chaque étape. J'ai aussi quelques les tests unitaires pour ce code.

def readlines_reversed(f):
""" Iterate over the lines in a file in reverse. The file must be
open in 'rb' mode. Yields the lines unencoded (as bytes), including the
newline character. Produces the same result as readlines, but reversed.
If this is used to reverse the line in a file twice, the result is
exactly the same.
"""
head = b""
f.seek(0, 2)
t = f.tell()
buffersize, maxbuffersize = 64, 4096
while True:
if t <= 0:
break
# Read next block
buffersize = min(buffersize * 2, maxbuffersize)
tprev = t
t = max(0, t - buffersize)
f.seek(t)
lines = f.read(tprev - t).splitlines(True)
# Align to line breaks
if not lines[-1].endswith((b"\n", b"\r")):
lines[-1] += head  # current tail is previous head
elif head == b"\n" and lines[-1].endswith(b"\r"):
lines[-1] += head  # Keep \r\n together
elif head:
lines.append(head)
head = lines.pop(0)  # can be '\n' (ok)
# Iterate over current block in reverse
for line in reversed(lines):
yield line
if head:
yield head

InformationsquelleAutor Almar

0

Lire le fichier ligne par ligne, puis de l'ajouter sur une liste dans l'ordre inverse.

Voici un exemple de code :
```
reverse = []
with open("file.txt", "r") as file:
for line in file:
line = line.strip()
reverse[0:0] = line
```
InformationsquelleAutor willywonka

import sys
f = open(sys.argv[1] , 'r')
for line in f.readlines()[::-1]:
print line

InformationsquelleAutor Powerup California

def previous_line(self, opened_file):
opened_file.seek(0, os.SEEK_END)
position = opened_file.tell()
buffer = bytearray()
while position >= 0:
opened_file.seek(position)
position -= 1
new_byte = opened_file.read(1)
if new_byte == self.NEW_LINE:
parsed_string = buffer.decode()
yield parsed_string
buffer = bytearray()
elif new_byte == self.EMPTY_BYTE:
continue
else:
new_byte_array = bytearray(new_byte)
new_byte_array.extend(buffer)
buffer = new_byte_array
yield None

à utiliser:

opened_file = open(filepath, "rb")
iterator = self.previous_line(opened_file)
line = next(iterator) #one step
close(opened_file)

InformationsquelleAutor Vyacheslav

-2

J'ai dû le faire il y a quelques temps et utilisé le code ci-dessous. Il des tuyaux pour le shell. Je crains de ne pas avoir le script complet plus. Si vous êtes sur un unixish système d'exploitation, vous pouvez utiliser "tac", mais, par exemple, Mac OSX tac commande ne fonctionne pas, l'utilisation de la queue -r. Ci-dessous l'extrait de code de tests pour la plate-forme sur laquelle vous êtes, et ajuste la commande en conséquence
```
# We need a command to reverse the line order of the file. On Linux this
# is 'tac', on OSX it is 'tail -r'
# 'tac' is not supported on osx, 'tail -r' is not supported on linux.
if sys.platform == "darwin":
command += "|tail -r"
elif sys.platform == "linux2":
command += "|tac"
else:
raise EnvironmentError('Platform %s not supported' % sys.platform)
```
- L'affiche est à la recherche d'un python de réponse.
- Eh bien, c'est un Python réponse même si il semble être incomplète.
- ce n'est pas , pas compatible , à l'aide des commandes du système d' = pas pythonic
- L'affiche est à la recherche d'une réponse "à l'aide de python", qui l'extrait de code est écrit en. Mais je suis d'accord c'est pas une très bonne solution par rapport à de nombreux autres celles qui sont transmises.
- L'extrait n'est pas assez complet pour évaluer l'exactitude de l' (d'autres parties de l'invocation ne sont pas indiquées), mais le stockage des commandes shell dans des chaînes est en soi hautement suspect -- il est facile d'injection de shell bugs à moins de prendre beaucoup de soin.
InformationsquelleAutor jeorgen

Vous devez vous connecter pour publier un commentaire.