python expression régulière correspondant à rien

Mon expression régulière n'est pas de faire quelque chose à ma chaîne.

python

data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article</article>', data, flags=re.MULTILINE)
print datareg

- je obtenir

random
<article stuff
</article>random stuff

je veux

<article stuff
</article>
Aw, allez: Pas Cthulhu Analyse encore une fois.
il ressemble à du code HTML mal formé pour moi, donc je doute un analyseur HTML serait en mesure de travailler avec elle très facilement.
Je pense que youÄre droit. Mais la substitution ne semble pas valide XML. Je me demande, à quoi faut-il cassé XML?

OriginalL'auteur user1442957 | 2012-09-12