Efficace de la lecture de 800 GO fichier XML dans Python 2.7

Je suis de la lecture d'un 800 GO fichier xml dans python 2.7 et l'analyser avec un programme etree itératif de l'analyseur.

Actuellement, je suis juste en utilisant open('foo.txt') sans mise en mémoire tampon de l'argument. Je suis un peu confus si c'est l'approche que je devrais prendre, ou, devrais-je utiliser un tampon d'un argument ou d'utiliser quelque chose de io comme io.BufferedReader ou io.ouvrir ou io.TextIOBase.

Un point dans la bonne direction serait très apprécié.

  • 800 go de fichier texte?! Mère de Dieu...À quel moment avez-vous les gars, vous voulez dire que c'est une bonne idée de jeter dans une base de données?
  • pire, le titre le dit le texte, mais le corps dit que c'est du XML
  • J'espère juste pour vous que le fichier est valide XML...
  • Est votre fichier de quelque chose comme: <root><item>...</item><item>...</item>...</root> que certains programmeurs java avant que vous avez utilisé pour vider un journal ou quelque chose?
  • peut-être qu'ils avaient à le faire de cette façon à respecter le mot d'ordre de la conformité auprès du département marketing.
  • C'est l'un des plus drôles les commentaires que j'ai jamais lu.
  • SI vous devez savoir, c'est une révision complète de vidage de Wikipedia en espagnol.

InformationsquelleAutor Mike S | 2013-02-13