Pourquoi est-impression sur la sortie standard si lent? Peut-il être accéléré?

J'ai toujours été étonné/frustré avec combien de temps cela prend simplement la sortie vers le terminal avec une instruction print. Après un récent lente et douloureuse de journalisation j'ai décidé de le regarder et a été très surpris de constater que presque tous le temps passé est en attente pour le terminal de traiter les résultats.

Peut écrire sur la sortie standard stdout être accéléré en quelque sorte?

J'ai écrit un script ('print_timer.py"au bas de cette question) pour comparer le timing lors de l'écriture de 100k lignes vers stdout vers un fichier, et avec stdout redirigé vers /dev/null. Voici le calendrier résultat:

$ python print_timer.py
this is a test
this is a test
<snipped 99997 lines>
this is a test
-----
timing summary (100k lines each)
-----
print                         :11.950 s
write to file (+ fsync)       : 0.122 s
print with stdout = /dev/null : 0.050 s

Wow. Pour assurez-vous que python n'est pas de faire quelque chose de derrière les scènes, comme la reconnaissance que j'ai réassigné stdout vers /dev/null ou quelque chose, j'ai fait la redirection à l'extérieur du script...

$ python print_timer.py > /dev/null
-----
timing summary (100k lines each)
-----
print                         : 0.053 s
write to file (+fsync)        : 0.108 s
print with stdout = /dev/null : 0.045 s

Donc ce n'est pas un python truc, c'est juste le terminal. J'ai toujours su que le dumping de sortie vers /dev/null accéléré les choses, mais jamais pensé que c'était que d'importants!

Il me stupéfie comment ralentir le tty est. Comment se peut-il que l'écriture sur le disque physique est plus rapide que d'écrire sur le "écran" (sans doute un RAM op), et il est effectivement aussi vite que de simplement le dumping à la poubelle avec /dev/null?

Ce lien parle de la façon dont le terminal block I/O de sorte qu'il peut "parse [entrée], mise à jour de son mémoire d'image, de communication avec le serveur X pour faire défiler la fenêtre et ainsi de suite"... mais je ne suis pas entièrement l'obtenir. Ce peut être aussi long?

Je m'attends il n'y a pas moyen d'en sortir (à moins de un plus rapide ats mise en œuvre?) mais la figure que je vais demander de toute façon.

Mise à JOUR: après lecture de certains commentaires, je me demandais comment beaucoup d'impact sur ma taille de l'écran en fait sur le temps d'impression, et il ne ont leur importance. La très lente chiffres ci-dessus sont avec mon Gnome terminal soufflé jusqu'à 1920x1200. Si je le réduire très petit je obtenir...

-----
timing summary (100k lines each)
-----
print                         : 2.920 s
write to file (+fsync)        : 0.121 s
print with stdout = /dev/null : 0.048 s

C'est certainement mieux (~4x), mais ne change pas ma question. Il ne ajoute à ma question que je ne comprends pas pourquoi l'écran du terminal de rendu devrait ralentir une application d'écriture sur la sortie standard stdout. Pourquoi mon programme besoin d'attendre pour le rendu à l'écran pour continuer?

Sont tous en phase terminale/ats apps pas créés égaux? Je n'ai pas encore l'expérience. Il semble vraiment à moi comme un terminal devrait être en mesure de tampon toutes les données entrantes, analyser/rendre invisible, et que rendre la plus récente morceau qui est visible dans l'écran de configuration à un bon taux de trame. Donc, si je peux écrire+fsync à disque en de ~0,1 secondes, un terminal devrait être en mesure d'effectuer la même opération dans quelque chose de cet ordre (avec peut-être quelques mises à jour d'écran alors qu'il l'a fait).

Je suis encore un peu en espérant que il y a un ats paramètre qui peut être modifié à partir de l'application côté pour faire de ce comportement de mieux pour le programmeur. Si c'est strictement une application de terminal problème, alors ce peut-être n'a même pas sa place sur StackOverflow?

Ce qui me manque?

Voici le programme en python utilisé pour générer le calendrier:

import time, sys, tty
import os

lineCount = 100000
line = "this is a test"
summary = ""

cmd = "print"
startTime_s = time.time()
for x in range(lineCount):
    print line
t = time.time() - startTime_s
summary += "%-30s:%6.3f s\n" % (cmd, t)

#Add a newline to match line outputs above...
line += "\n"

cmd = "write to file (+fsync)"
fp = file("out.txt", "w")
startTime_s = time.time()
for x in range(lineCount):
    fp.write(line)
os.fsync(fp.fileno())
t = time.time() - startTime_s
summary += "%-30s:%6.3f s\n" % (cmd, t)

cmd = "print with stdout = /dev/null"
sys.stdout = file(os.devnull, "w")
startTime_s = time.time()
for x in range(lineCount):
    fp.write(line)
t = time.time() - startTime_s
summary += "%-30s:%6.3f s\n" % (cmd, t)

print >> sys.stderr, "-----"
print >> sys.stderr, "timing summary (100k lines each)"
print >> sys.stderr, "-----"
print >> sys.stderr, summary

Le but entier de l'écriture sur la sortie standard est donc un homme peut lire le résultat. Aucun être humain dans le monde peut lire les 10 000 lignes de texte en 12 secondes, quel est donc le point de faire stdout plus vite???
Osewa: Un exemple (qui a conduit à ma question), c'est quand faisant des choses comme imprimer instruction de débogage. Vous souhaitez lancer votre programme et de voir les résultats comme ils se produisent. Vous êtes évidemment raison que la plupart des lignes à la mouche que vous ne pouvez pas voir, mais quand une exception se produit (ou vous frappez le conditionnel getch/raw_input/instruction de mise en veille vous soigneusement placé) vous voulez être à la recherche à la sortie d'impression directement, plutôt que de constamment avoir à ouvrir ou à l'actualisation d'un fichier de point de vue.
Imprimer instruction de débogage est l'une des raisons pour lesquelles les périphériques tty (c'est à dire les bornes) par défaut à la ligne de mise en mémoire tampon à la place du bloc de mise en mémoire tampon: la sortie de débogage n'est pas grande utilité si le programme se bloque et le dernier quelques lignes de sortie de débogage sont encore dans un tampon au lieu d'aboutir dans le terminal.
C'est pourquoi je n'ai pas pris la peine beaucoup à la poursuite d'énormes améliorations un intervenant revendiquée par manivelle jusqu'à la taille de la mémoire tampon. Entièrement défait le but de l'impression de débogage! J'ai fait l'expérience un peu lors de l'enquête, mais ne voit pas la nette amélioration. Je suis toujours curieux de connaître la différence, mais pas vraiment.
Parfois pour très longtemps programmes en cours d'exécution, je vais juste l'impression de la ligne actuelle stdout toutes les n secondes -- semblable à avoir un temps de rafraîchissement dans un malédictions app. Il n'est pas parfait, mais donne une idée de ce qui est où je suis à la fois dans un tout.

InformationsquelleAutor Russ | 2010-10-04

148

Comment se peut-il que l'écriture sur le disque physique est plus rapide que d'écrire sur le "écran" (sans doute un RAM op), et il est effectivement aussi vite que de simplement le dumping à la poubelle avec /dev/null?

Félicitations, vous venez de découvrir l'importance de l'I/O tampon. 🙂

Le disque apparaît pour être plus rapide, car il est très tampon: toutes Python write() les appels sont de retour avant que quelque chose est effectivement écrit sur le disque physique. (Le système d'exploitation ne présente plus tard, en combinant plusieurs milliers de écrit dans un grand, efficace morceaux.)

Le terminal, d'autre part, n'a que peu ou pas de mise en mémoire tampon: chaque individu print /write(line) attend le plein écrire (c'est à dire l'affichage de sortie de l'appareil) pour valider.

Que la comparaison soit juste, vous devez créer le fichier de test à utiliser le même tampon de sortie comme le terminal, qui vous pouvez le faire en modifiant votre exemple:
```
fp = file("out.txt", "w", 1)   # line-buffered, like stdout
[...]
for x in range(lineCount):
    fp.write(line)
    os.fsync(fp.fileno())      # wait for the write to actually complete
```
J'ai couru votre fichier test écrit sur ma machine, et avec mise en mémoire tampon, il a également 0,05 s ici pour 100 000 lignes.

Cependant, avec les modifications ci-dessus pour écrire sans tampon, il faut 40 secondes pour écrire que 1 000 lignes sur le disque. Je me gave d'attendre pour 100 000 lignes à écrire, mais l'extrapolation à partir de la précédente, il faudrait plus d'une heure.

Qui met le terminal de 11 secondes en perspective, n'est-ce pas?

Donc, pour répondre à votre question de départ, l'écriture d'un terminal est en fait extrêmement rapide, toutes choses considérées, et il n'y a pas beaucoup de place pour le rendre beaucoup plus rapide (mais chacun des terminaux ne varient dans la quantité de travail qu'ils font; voir Russ commentaire à cette réponse).

(Vous pouvez ajouter plus d'écrire de mise en mémoire tampon, comme avec les I/O disque, mais alors vous ne serait pas voir ce qui était écrit à votre terminal jusqu'à ce que après le buffer est vidé. C'est un compromis: l'interactivité contre vrac efficacité.)
- Je reçois I/O tampon... vous avez certainement m'a rappelé que je devrais avoir fsync avais pour une comparaison des temps d'exécution (je vais mettre à jour la question), mais un fsync par ligne est de la folie. Ne ats vraiment besoin pour le faire? Il n'y a pas de terminal/os-côté mise en mémoire tampon équivalent pour les fichiers? c'est à dire: les Applications d'écrire sur la sortie standard et de la retourner avant de terminal rend à l'écran, avec le terminal (ou os) mise en mémoire tampon de tout. Le terminal peut alors raisonnablement rendre la queue de l'écran à une image visible de taux. Bloquant sur chaque ligne semble idiot. Je sens que je suis toujours en manque de quelque chose.
- Vous pouvez simplement ouvrir un handle vers stdout avec un gros tampon de vous-même, en utilisant quelque chose comme os.fdopen(sys.stdout.fileno(), 'w', BIGNUM). Ce serait presque jamais être utile, bien que presque toutes les demandes devront rappeler explicitement de le rincer après chaque ligne de l'utilisateur de sortie prévue.
- J'ai expérimenté auparavant avec d'énormes (jusqu'à 10 mo avec fp = os.fdopen(sys.__stdout__.fileno(), 'w', 10000000)) python côté tampons. L'Impact a été de néant. c'est à dire: encore long ats retards. Cela m'a fait penser/réaliser que vous venez de reporter la lente ats problème... quand python tampon enfin bouffées de chaleur de l'ats semble toujours faire la même quantité totale de traitement sur le cours d'eau avant de retourner.
- Notez que cette réponse est erronée et trompeuse (désolé!). Plus précisément, il est faux de dire "il n'y a pas beaucoup de place pour le rendre plus rapide [11 secondes]". Merci de voir ma propre réponse à la question " d'où je montre que les wterm terminal atteint le même 11s résultat de 0,26 s.
- Russ: merci pour le feedback! De mon côté, une plus grande fdopen tampon (2 MO) certainement fait une énorme différence: il a pris le temps d'impression vers le bas à partir de plusieurs secondes à 0,05 s, même en tant que fichier de sortie (à l'aide de gnome-terminal).
InformationsquelleAutor Pi Delport
85

Merci pour tous les commentaires! J'ai fini de répondre moi-même avec votre aide. Il se sent sale répond à votre question, si.

Question 1: Pourquoi est-impression sur stdout lent?

Réponse: Impression sur stdout est pas par nature lent. C'est le terminal vous travaillez avec qui est lent. Et il a à peu près nulle à faire avec les e/S de mise en mémoire tampon de l'application (par exemple: python fichier de mise en mémoire tampon). Voir ci-dessous.

Question 2: Peut-il être accéléré?

Réponse: Oui il peut, mais apparemment pas du programme (le côté faisant le '"impression" sur la sortie standard stdout). Pour l'accélérer, utiliser plus rapidement les différents émulateur de terminal.

Explication...

J'ai essayé un auto-proclamé 'léger' programme de terminal appelé wterm et a obtenu significativement de meilleurs résultats. Ci-dessous est la sortie de mon script de test (au fond de la question) lors de l'exécution dans wterm à 1920x1200 sur le même système où l'option d'impression pris 12s à l'aide de gnome-terminal:
```
----- 
calendrier récapitulatif (100k lignes chacun) 
----- 
impression : 0.261 s 
écrire dans le fichier (+fsync) : 0.110 s 
imprimer avec stdout = /dev/null : 0.050 s 
```
De 0,26 s est BEAUCOUP mieux que de 12 ans! Je ne sais pas si wterm est plus intelligent sur la façon dont il rend à l'écran le long de la lignes de la façon dont j'ai été suggérant (rendre le "visible" de la queue, à un taux de trame), ou si c'est juste "ne le moins" que gnome-terminal. Pour les besoins de ma question, j'ai eu la réponse. gnome-terminal est lente.

Si - Si vous avez une longue course script qui vous vous sentez est lent et il crache des quantités massives de texte sur la sortie standard stdout... essayez un autre terminal, et voir si c'est mieux!

Remarque que j'ai à peu près au hasard tiré wterm d'ubuntu/debian dépôts. Ce lien peut-être le même terminal, mais je ne suis pas sûr. Je n'ai pas tester les autres émulateurs de terminal.

Mise à jour: Parce que j'ai eu à gratter la démangeaison, j'ai testé tout un tas d'autres émulateurs de terminal avec le même script et en plein écran (1920 x 1200). Mon manuellement recueillies stats sont ici:
```
wterm 0,3 s 
aterm 0,3 s 
rxvt 0,3 s 
mrxvt 0,4 s 
konsole 0,6 s 
yakuake 0,7 s 
lxterminal 7s 
xterm 9s 
gnome-terminal 12s 
xfce4-terminal 12s 
vala-terminal de 18 ans 
xvt 48s 
```
Les temps enregistrés sont collectées manuellement, mais ils étaient assez cohérentes. J'ai enregistré la meilleure(ish) de la valeur. YMMV, évidemment.

En prime, il était intéressant, la visite de certains des différents émulateurs de terminaux disponibles là-bas! Je suis étonné de voir que mon premier "remplaçant" le test s'est avéré être le meilleur du groupe.
- Vous pouvez également essayer de aterm. Voici les résultats de mon test à l'aide de votre script. Aterm - impression: 0.491 s, écrire dans le fichier (+fsync): 0.110 s, imprimer avec stdout = /dev/null: 0.087 s wterm - impression: 0.521 s, écrire dans le fichier (+fsync): de 0,105 s, imprimer avec stdout = /dev/null : 0.085 s
- Merci pour le conseil... je vais l'ajouter à la liste. Je reçois un peu plus grave, mais assez proche. Tous les chiffres sont à un sentiment général, de toute façon.
- Comment urxvt comparer à rxvt?
- Ne wterm l'appui du texte UTF-8? Sur mon Ubuntu 9.10, il semble qu'il ne l'est pas.
- Aussi, screen, (le programme) devrait être inclus sur la liste! (Ou byobu, qui est un wrapper pour screen avec des améliorations) Cet utilitaire permet d'avoir plusieurs terminaux, comme les onglets dans les terminaux X. Je présume que l'impression de l'actuel screen's terminal est le même que l'impression d'un simple, mais ce que sur l'impression dans l'un des screen's terminal et ensuite passer à une autre sans activité?
- Bizarre, il y a quelques temps j'ai été en comparant les différents terminaux en termes de vitesse et de gnome-terminal est entré meilleur plutôt sérieux tests alors que xterm a été la plus lente. Peut-être qu'ils ont travaillé dur sur la mise en mémoire tampon depuis. Également le support de l'unicode pourrait faire une grande différence.
- votre lien est mort maintenant.
- yep, c'est vrai... Dans le temps, c'est sa page SourceForge: sourceforge.net/projects/wterm
- iTerm2 sur OSX m'a donné: print: 0.587 s, write to file (+fsync): 0.034 s, print with stdout = /dev/null : 0.041 s. Et avec "l'écran" en cours d'exécution dans iTerm2: print: 1.286 s, write to file (+fsync): 0.043 s, print with stdout = /dev/null : 0.033 s
InformationsquelleAutor Russ
13

Votre redirection probablement ne fait rien comme les programmes peuvent déterminer si leur sortie FD points ats.

Il est probable que stdout est en ligne mises en mémoire tampon lorsque pointant vers un terminal (le même que C est stdout flux de comportement).

Comme une amusante expérience, essayez de la tuyauterie de sortie de cat.

J'ai essayé ma propre expérience amusante, et voici les résultats.
```
$ python test.py 2>foo
...
$ cat foo
-----
timing summary (100k lines each)
-----
print                         : 6.040 s
write to file                 : 0.122 s
print with stdout = /dev/null : 0.121 s

$ python test.py 2>foo |cat
...
$ cat foo
-----
timing summary (100k lines each)
-----
print                         : 1.024 s
write to file                 : 0.131 s
print with stdout = /dev/null : 0.122 s
```
- Je ne pense pas que python la vérification de sa sortie FS. Je me demande si python est en tirant un truc de derrière les coulisses? Je m'attends pas, mais vous ne savez pas.
- +1 pour souligner l'importance de la différence dans la mise en mémoire tampon
- le -u option forces stdin, stdout et stderr être sans tampon, ce qui sera plus lent que d'être bloc de mémoire tampon (en raison de frais généraux)
InformationsquelleAutor Hasturkun
4

Je ne peux pas parler de la technique détails, car je ne les connais pas, mais cela ne m'étonne pas: le terminal n'a pas été conçue pour l'impression des lots de données comme cela. En effet, même vous fournir un lien à une charge de GUI, des choses que il a à faire à chaque fois que vous souhaitez imprimer quelque chose! Notez que si vous appelez le script avec pythonw au lieu de cela, il ne prend pas 15 secondes; c'est tout à fait un GUI question. Rediriger stdout à un fichier pour éviter cela:
```
import contextlib, io
@contextlib.contextmanager
def redirect_stdout(stream):
    import sys
    sys.stdout = stream
    yield
    sys.stdout = sys.__stdout__

output = io.StringIO
with redirect_stdout(output):
    ...
```
InformationsquelleAutor Katriel
3

L'impression que le terminal est lente. Malheureusement court de l'écriture d'un nouveau terminal de mise en œuvre, je ne vois pas vraiment comment vous pouvez accélérer de manière significative.

InformationsquelleAutor shuttle87
2

En plus de la sortie sans doute par défaut d'une ligne-mode mémoire tampon, la sortie d'un terminal est également à l'origine de vos données de flux dans un terminal et la ligne série avec un débit maximum, ou un pseudo-terminal et un processus distinct qui est de la manipulation d'un affichage de boucle d'événements, le rendu des personnages de certains de police, le déplacement de l'affichage des bits à mettre en œuvre un défilement de l'affichage. Le dernier scénario est probablement réparties sur plusieurs processus (par exemple, telnet, client/serveur, le terminal de l'application, serveur d'affichage X11), alors il existe un changement de contexte et les problèmes de latence trop.
- Vrai! Ce qui m'a poussé à essayer de réduire mon terminal la taille de la fenêtre (sous Gnome) à quelque chose de pitoyable (à partir de 1920 x 1200). Bien sûr... 2.8 s le temps d'impression, vs 11.5 s. Beaucoup mieux, mais quand même... pourquoi est-ce décrochage? On pourrait penser que la sortie standard (stdout) tampon (hmm) pourrait gérer tous les 100k lignes et l'affichage du terminal serait-il suffit de saisir tout ce qu'il peut s'adapter à l'écran à partir de la fin de la queue de la mémoire tampon et de le faire en un coup rapide.
- Le xterm (ou gterm, dans ce cas) serait de rendre votre éventuelle écran plus rapidement si elle ne pense pas qu'il avait pour afficher toutes les autres de sortie le long de la voie ainsi. Si c'était pour essayer d'aller dans cette voie, il serait probablement le cas le plus courant des petites mises à jour d'écran semblent moins sensibles. Lors de l'écriture de ce type de logiciel, vous pouvez parfois faire face avec elle en ayant des modes différents et d'essayer de détecter lorsque vous devez déplacer vers/à partir d'un petit en vrac mode de fonctionnement. Vous pouvez utiliser cat big_file | tail ou même cat big_file | tee big_file.cpy | tail très souvent pour cette vitesse.
InformationsquelleAutor Liudvikas Bukys

Vous devez vous connecter pour publier un commentaire.