Python - Lecture Emoji Caractères Unicode

J'ai un Python 2.7 programme qui lit l'iOS messages texte à partir d'une base de données SQLite. Les messages texte sont des chaînes unicode. Dans le texte suivant message:

u'that\u2019s \U0001f63b'

L'apostrophe est représenté par \u2019, mais l'emoji est représenté par \U0001f63b. J'ai regardé le code de point pour l'emoji en question, et c'est \uf63b. Je ne suis pas sûr de l'endroit où le 0001. Je sais comique, c'est que peu de choses sur les encodages de caractères.

Lorsque j'imprime le texte, caractère par caractère, à l'aide de:

s = u'that\u2019s \U0001f63b'

for c in s:
    print c.encode('unicode_escape')

Le programme produit le résultat suivant:

t
h
a
t
\u2019
s

\ud83d
\ude3b

Comment puis-je lire correctement ces derniers caractères en Python? Suis-je à l'aide de coder correctement ici? Devrais-je tenter de la corbeille ceux 0001s avant de le lire, ou est-il plus facile, moins stupide?

0xf63b est dans la "Usage Privé" de la section de l'Unicode. Êtes-vous sûr que c'est correct? Votre codepoint est probablement 0x1f63b, car c'est un "chat souriant avec les yeux du coeur" icônes emoji.
Comment avez-vous déterminer qui \uf63b serait un Emoji personnage? Selon ma référence, c'est pas défini: fileformat.info/info/unicode/char/f63b/index.htm

OriginalL'auteur Andrew LaPrise | 2015-07-07