ParseError: pas bien formé (invalid token) à l'aide de cElementTree

- Je recevoir des chaînes xml à partir d'une source externe qui contient unsanitized utilisateur contribué au contenu.

Le code xml suivant de la chaîne a donné un ParseError dans cElementTree:

>>> print repr(s)
'<Comment>dddddddd\x08\x08\x08\x08\x08\x08_____</Comment>'
>>> import xml.etree.cElementTree as ET
>>> ET.XML(s)

Traceback (most recent call last):
  File "<pyshell#4>", line 1, in <module>
    ET.XML(s)
  File "<string>", line 106, in XML
ParseError: not well-formed (invalid token): line 1, column 17

Est-il un moyen de faire cElementTree pas se plaindre?

OriginalL'auteur BioGeek | 2012-10-24