Comment lire un texte utf-8 fichier à l'aide de Python

J'ai besoin d'analyser un fichier texte dans le tamil (utf-8). Im en utilisant nltk paquet de Python sur l'interface d'INACTIVITÉ. lorsque je tente de lire le fichier texte sur l'interface, c'est l'erreur que j'obtiens. comment puis-je éviter cela?

corpus = open('C:\\Users\\Customer\\Desktop\\DISSERTATION\\ettuthokai.txt').read()

Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    corpus = open('C:\\Users\\Customer\\Desktop\\DISSERTATION\\ettuthokai.txt').read()
  File "C:\Users\Customer\AppData\Local\Programs\Python\Python35-32\lib\encodings\cp1252.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 33: character maps to <undefined>
Je n'ai pas entièrement lu votre question, mais... Si vous avez une charge d'octets, vous pouvez décoder dans une chaîne de caractères à l'aide de your_bytes.decode("UTF-8").
Qui version de Python?
De la traçabilité en amont, je en déduire Python3.

OriginalL'auteur Ramprashanth | 2016-12-01