supprimer unicode emoji à l'aide de re en python

J'ai essayé d'enlever l'emoji à partir d'une unicode tweet de texte et d'imprimer le résultat en python 2.7 utilisation

myre = re.compile(u'[\u1F300-\u1F5FF\u1F600-\u1F64F\u1F680-\u1F6FF\u2600-\u26FF\u2700-\u27BF]+',re.UNICODE)
print myre.sub('', text)

mais il semble que presque tous les personnages sont retirés du texte. J'ai vérifié plusieurs réponses d'autres postes, malheureusement, aucun d'entre eux travaille ici. Ai-je fais quelque chose de mal dans la ré.compiler()?

voici un exemple de sortie que tous les personnages ont été supprimés:

   '   //./” ! # # # …
  • Est-ce Python 2? Python peut être construire large ou étroit support de l'Unicode; vous avez probablement un UCS-2 construire, plutôt que de l'UCS-4, et qui affecte ce que vous pouvez faire avec des expressions régulières.
  • Et s'il vous plaît donnez-nous un échantillon d'entrée trop.
  • J'ai été en mesure de reproduire votre problème, et j'ai aussi vu qu'un UCS-2 construire déclenche une exception lorsque vous essayez de compiler l'expression de toute façon, donc ce n'est pas la question ici.
  • u'\u1f300' devrait être u'\U0001f300'. La première est '\u1f30' et '0'.
InformationsquelleAutor Young | 2014-10-26