la conversion binaire vers l'utf-8 en python

J'ai un fichier binaire comme ceci:
1101100110000110110110011000001011011000101001111101100010101000

et je veux le convertir en utf-8.
comment puis-je le faire en python?

Ce codage est la chaîne binaire? ASCII? Ou vous voulez dire que les octets sont codé en utf-8 chaîne et que vous souhaitez obtenir une chaîne unicode en python?
Qu'entendez-vous par "convertir en utf-8"? Créer les personnages de la binaire octets?
la chaîne binaire est en utf-8 et oui, je veux recevoir une chaîne unicode en python.
Je pense que nous ne sommes pas comprendre exactement quel type de fichier que vous avez. Pourriez-vous exécuter hd ou od ou similaire hex-utilitaire de vidage et de copier-coller les premières lignes?
ce n'est pas un fichier. J'ai juste un texte en persan et je la convertir en binaire, maintenant, je veux convertir le texte.

OriginalL'auteur Aidin.T | 2013-10-08

10

Cleaner version:
```
>>> test_string = '1101100110000110110110011000001011011000101001111101100010101000'
>>> print ('%x' % int(test_string, 2)).decode('hex').decode('utf-8')
نقاب
```
Inverse (de @Robᵩ commentaire):
```
>>> '{:b}'.format(int(u'نقاب'.encode('utf-8').encode('hex'), 16))
1: '1101100110000110110110011000001011011000101001111101100010101000'
```
+1 pour .decode('hex')
mais il ne fonctionne pas correctement. il montre quelque chose d'autre, pas le premier texte que j'ai juste converti en binaire
essayez-le maintenant. J'ai ajouté decode('utf-8') à la fin.
Et l'inverse serait: s=u'نقاب'; print '{:b}'.format(int(s.encode('utf-8').encode('hex'), 16))
Notez que s = "سلام" et s = u"سلام" donner des résultats différents. L'ancien échoue, les dernières œuvres. Mais arrêtons de résoudre le nouveau problème. @Aidin.T, si vous avez un problème avec codage, veuillez ouvrir une nouvelle question.

OriginalL'auteur Igonato
4

Bien, l'idée que j'ai est:
1. Diviser la chaîne en octets
2. Convertir l'octet hexadécimal en utilisant int et plus tard chr
3. Se joindre à eux et de décoder la chaîne utf-8 en Unicode

Ce code fonctionne pour moi, mais je ne suis pas sûr de ce qu'il ne l'imprimerie, car je n'ai pas l'utf-8 dans ma console (Windows 😛 ).
```
s = '1101100110000110110110011000001011011000101001111101100010101000'
u = "".join([chr(int(x,2)) for x in [s[i:i+8] 
                           for i in range(0,len(s), 8)
                           ]
            ])
d = u.decode('utf-8')
```
Espérons que cette aide!

je crois que vous voulez unichr
Hmmm, je suis un peu méfiant de unichr. Parce que l'OP dit sa binaire est déjà en utf-8. utf-8 est variable de caractères, donc j'ai simplement utilisé chr pour rejoindre le raw octets en une chaîne de caractères et de les décoder plus tard dans Unicode.
Je suis en désaccord, en supposant que Python2. Dans cette étape, il est de recueillir des octets, pas de caractères. Seulement après qu'il a codé en utf-8 octet string-t-il à convertir.
C'est mon point de vue. Belle réponse, l'amour de la split('........'). Je pense que est fondamentalement la même idée que moi. +1
+1 - C'est la même technique que la mienne (donc évidemment j'approuve), en plus de vous expliqué le vôtre. Interlocuteur doit déplacer le vérifier à cette meilleure réponse.

OriginalL'auteur Paulo Bu

>>> s='1101100110000110110110011000001011011000101001111101100010101000'
>>> print (''.join([chr(int(x,2)) for x in re.split('(........)', s) if x ])).decode('utf-8')
نقاب
>>>

Ou, à l'inverse:

>>> s=u'نقاب'
>>> ''.join(['{:b}'.format(ord(x)) for x in s.encode('utf-8')])
'1101100110000110110110011000001011011000101001111101100010101000'
>>>

il est une autre question, comment puis-je convertir mon texte en binaire par python? Je veux dire l'inverse de la forme de ma question

OriginalL'auteur Robᵩ

1

Utilisation:
```
def bin2text(s): return "".join([chr(int(s[i:i+8],2)) for i in xrange(0,len(s),8)])


>>> print bin2text("01110100011001010111001101110100")
>>> test
```
pour mon texte, il revient à ceci: "\xd9\x86\xd9\x82\xd8\xa7\xd8\xa8", comment puis-je l'obtenir dans la bonne façon de le montrer?
Vous souhaitez unichr(), pas seulement chr(). docs.python.org/2/library/functions.html#unichr

OriginalL'auteur Nacib Neme

Vous devez vous connecter pour publier un commentaire.