Python lecture à partir d'un fichier et d'économie de l'utf-8

Je vais avoir des problèmes de lecture à partir d'un fichier, le traitement de la corde et de l'enregistrement dans un Fichier UTF-8.

Voici le code:

try:
    filehandle = open(filename,"r")
except:
    print("Could not open file " + filename)
    quit() 

text = filehandle.read()
filehandle.close()

Je puis faire un peu de traitement sur le texte d'une variable.

Et puis

try:
    writer = open(output,"w")
except:
    print("Could not open file " + output)
    quit() 

#data = text.decode("iso 8859-15")    
#writer.write(data.encode("UTF-8"))
writer.write(text)
writer.close()

Cette sortie du fichier à merveille, mais il le fait dans la norme iso 8859-15 selon mon éditeur. Depuis le même éditeur reconnaît le fichier d'entrée (dans la variable nom de fichier) en UTF-8 je ne sais pas pourquoi c'est arrivé. En ce qui concerne ma recherche a montré les lignes commentées devrait résoudre le problème. Cependant quand j'utilise ces lignes, le fichier résultant est du charabia à caractère spécial, principalement, les mots avec un tilde que le texte est en espagnol. Je voudrais vraiment apprécier l'aide que je suis perplexe....

  • L'éditeur est-ce? Qui version de python? De là, ce code semble être tout à fait valable, et doit fonctionner comme prévu ...
  • Kate est l'éditeur. La sortie de python --version Python 2.7.5+
  • J'ai testé votre code avec 2.6.8, 2.7.5+ et 3.3.2+ tout fonctionne bien. Pourriez-vous donner quelques exemple d'entrée?
  • Depuis, le texte a été transformé en raw octets de l'invisible code de traitement probablement foiré le codage UTF8.
  • J'aimerais donner un exemple de fichier cependant je ne peux pas trouver un moyen de téléchargé ici...
  • J'ai commenté tous mes invisibles code cependant l'erreur reste. C'était une bonne idée...
  • Ok. Je l'ai résolu. Il a surtout été de ma faute, désolé tout le monde. Voici ce qui s'est passé. Le code fourni par @MarkTolonen travaillé si je change d'iso-8859-15 au lieu de utf-8 lors de l'ouverture du fichier. Cependant, comme mon éditeur mis à jour le fichier à partir de la mémoire ayant déjà chargé l'ancien codage il m'a montré le charabia. Quand j'ai ouvert le fichier à nouveau, il me l'a montrée très bien. Merci à tous et désolé pour la peine!!!

InformationsquelleAutor aarelovich | 2013-10-25