Comment puis-je convertir LF à CRLF?

J'ai trouvé une liste de la plupart des mots anglais en ligne, mais les sauts de ligne sont de type unix (encodés en Unicode: UTF-8). Je l'ai trouvé sur ce site: http://dreamsteep.com/projects/the-english-open-word-list.html

Comment puis-je convertir les sauts de ligne pour CRLF afin que je puisse effectuer une itération sur eux? Le programme que je vais utiliser en va à travers chaque ligne dans le fichier, de sorte que les mots doivent être d'un par ligne.

C'est une partie du fichier: bitbackbitebackbiterbackbitersbackbitesbackbitingbackbittenbackboard

Il devrait être:

bit
backbite
backbiter
backbiters
backbites
backbiting
backbitten
backboard

Comment puis-je convertir mes fichiers de ce type? Remarque: il est 26 de fichiers (un par lettre) avec 80 000 mots au total (de sorte que le programme devrait être très rapide).

Je ne sais pas par où commencer, parce que je n'ai jamais travaillé avec unicode. Merci à l'avance!

À l'aide de rU en tant que paramètre (comme l'a suggéré), avec ceci dans mon code:

with open(my_file_name, 'rU') as my_file:
    for line in my_file:
        new_words.append(str(line))
my_file.close()

J'obtiens cette erreur:

Traceback (most recent call last):
  File "<pyshell#5>", line 1, in <module>
    addWords('B Words')
  File "D:\my_stuff\Google Drive\documents\SCHOOL\Programming\Python\Programming Class\hangman.py", line 138, in addWords
    for line in my_file:
  File "C:\Python3.3\lib\encodings\cp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 7488: character maps to <undefined>

Quelqu'un peut-il m'aider?

vous pourriez peut-être trouver ce stackoverflow.com/questions/3891076/... utile
Ne pouvez-vous pas faire votre programme capable de gérer les deux types de fin de ligne?
J'ai déjà un fichier avec une liste de mots. En outre, je n'ai jamais utilisé unicode (comme il dit) donc je ne sais pas comment gérer ces types de terminaisons.
Dans unix, utilisez la commande sed

OriginalL'auteur Rushy Panchal | 2012-12-19