Conseils pour garder Perl utilisation de la mémoire faible

Quels sont les bons conseils pour garder la mémoire d'utilisation de la basse dans un script Perl? Je suis intéressé à apprendre comment garder ma mémoire, aussi bas que possible pour les systèmes selon les programmes Perl. Je sais que Perl n'est pas génial quand il s'agit de l'utilisation de la mémoire, mais je voudrais savoir si il y a des conseils pour l'améliorer.

Alors, que pouvez-vous faire pour garder un script Perl qui utilise moins de mémoire. Je suis intéressé par toutes les suggestions, s'ils sont réels conseils pour l'écriture de code, ou des conseils pour savoir comment compiler Perl différemment.

Modifier pour Bounty:
J'ai un programme en perl qui sert de serveur pour une application réseau. Chaque client qui se connecte à elle obtienne sa propre processus enfant actuellement. J'ai utilisé les threads au lieu de fourches ainsi, mais je n'ai pas été en mesure de déterminer si l'utilisation de threads au lieu de fourche est en fait plus efficace en terme de mémoire.

Je voudrais essayer de l'utilisation de threads au lieu de fourchettes de nouveau. Je crois en théorie, il devrait enregistrer sur l'utilisation de la mémoire. J'ai quelques questions à cet égard:

Ne threads créés en Perl empêcher la copie des bibliothèques de modules Perl
en mémoire pour chaque thread?
Est fils (fils) le moyen le plus efficace (ou la seule)
façon de créer des threads en Perl?
Dans les fils, je peux spécifier un stack_size paramater, qu'est-ce spécifiquement
dois-je considérer lors de la spécification de cette valeur, et quelle est son incidence
l'utilisation de la mémoire?

Avec les threads en Perl/Linux, ce qui est la méthode la plus fiable pour déterminer le montant réel de l'utilisation de la mémoire sur une base par thread?

C'est une très vaste question. Les conseils peuvent être moins aléatoire si vous pouvez fournir certaines tâches que vous voulez accomplir.
Je pense que vous devriez sortir de votre questions supplémentaires dans de nouveaux Stackoverflow questions.
Ouais j'avais pensé que permettrait d'obtenir une meilleure réponse, mais j'ai réalisé qu'après que j'ai d'installation de la bounty. Maintenant, je ne suis pas sûr de savoir comment j'allais faire de si. Est-il possible d'annuler un bounty? Je ne pense pas que ça :-/
Notez que les "fils" ne crée pas ce que les gens normalement appeler "fils" en dehors de Perl: "utiliser des threads" émule un processus normal, et est généralement beaucoup plus lent, et plus que réel threads ou processus réels, par exemple, "fils" émule le MMU dans le logiciel et le rend plus ou moins complète des copies physiques de chaque thread qui crée un nouveau thread.
pour perl meilleure prise en charge est de fourche. les threads en perl sont comme des étrangers. il y a beaucoup de bugs, des conditions de course ou les serrures. spécialement, si vous utilisez dans le thread travailleur fourche, les opérations d'e/S et les tuyaux. Il ya une grande chance, votre fil raccrocher, et vous en tant que solution de contournement doit détacher. Il n'est pas vrai, la nature de threads en perl est avec du fil de l'émulation par la fourche. Généralement sur linux threads sont très proches de processus. Il devrait économiser de la mémoire, mais pas en perl. Lorsque vous permettra de créer des threads en perl, toutes les variables seront dupliqués comme une copie de fil. Ensuite, une meilleure utilisation de la fourche et de sélectionner les fonctions.

InformationsquelleAutor GoldenNewby | 2012-03-16

memory perl

79

Quel type de problème vous êtes en cours d'exécution, et que signifie "grand" signifie pour vous? J'ai des amis, vous devez charger 200 Go de fichiers en mémoire, de sorte que leur idée de bons conseils est très différent que le budget shopper pour un minimum de VM tranches de souffrance avec 250 Mo de RAM (vraiment? Mon téléphone a plus que cela).

En général, Perl, tient toute la mémoire que vous utilisez, même si il ne l'utilise pas. Réaliser que l'optimisation de la dans une direction, par exemple la mémoire, pourrait avoir un impact négatif de l'autre, comme la vitesse.

Ce n'est pas une liste exhaustive (et il y a de plus en Programmation Perl):

☹ Utiliser Perl le profilage de la mémoire d'outils pour vous aider à trouver les zones à problème. Voir Le profilage des tas utilisation de la mémoire sur les programmes perl et Comment trouver la quantité de mémoire physique occupé par une table de hachage en Perl?

☹ Utiliser des variables lexicales avec le plus petit périmètre possible afin de permettre à Perl pour la ré-utilisation de la mémoire lorsque vous n'en avez pas besoin.

☹ Éviter de créer de grandes structures temporaires. Par exemple, la lecture d'un fichier avec un foreach lit toutes les entrées à la fois. Si vous avez seulement besoin d'elle, ligne par ligne, de while.
```
 foreach ( <FILE> ) { ... } # list context, all at once 
 while( <FILE> ) { ... } # scalar context, line by line
```
☹ Vous pourriez même pas besoin d'avoir le fichier en mémoire. Carte mémoire les fichiers au lieu d'aspirer eux

☹ Si vous avez besoin pour créer des structures de données, pensez à quelque chose comme DBM::Deep ou d'autres moteurs de stockage pour garder la plupart de la mémoire vive et sur le disque jusqu'à ce que vous en avez besoin.

☹ Ne pas laisser les gens utiliser votre programme. Chaque fois que je l'ai fait, j'ai réduit l'empreinte mémoire d'environ 100%. Il réduit également sur les demandes de support.

☹ Passer de gros morceaux de texte et de grands agrégats de référence afin de ne pas faire une copie, ainsi stocker deux fois la même information. Si vous avez à le copier parce que vous voulez changer quelque chose, vous pourriez être coincé. Cela va dans les deux sens comme sous-routine arguments et les valeurs de retour de sous-routine:
```
 call_some_sub( $big_text, \@long_array );
 sub call_some_sub {
      my( $text_ref, $array_ref ) = @_;
      ...
      return \%hash;
      }
```
☹ Traquer les fuites de mémoire dans les modules. J'ai eu de gros problèmes avec une application jusqu'à ce que j'ai réalisé que un module n'était pas la libération de la mémoire. J'ai trouvé un patch dans le module de la RT file d'attente, appliqué, et résolu le problème.

☹ Si vous avez besoin de gérer un gros morceau de données une fois, mais ne veulent pas de la persistance de la mémoire, de confier les travaux à un processus enfant. Le processus de l'enfant a seulement l'empreinte mémoire pendant qu'il tourne. Lorsque vous obtenez la réponse, le processus de l'enfant s'arrête et la libère de la mémoire. De même, le travail des systèmes de distribution de Gearman, peut se propager de travail entre les machines.

☹ Tour récursive des solutions dans itératif ceux. Perl n'a pas de queue à la récursivité d'optimisation, de sorte que chaque nouveau téléphone, qui s'ajoute à la pile d'appel. Vous pouvez optimiser la queue problème vous-même avec des astuces avec goto ou d'un module, mais c'est beaucoup de travail pour accrocher une technique que vous n'avez probablement pas besoin.

☹ N'a-t-il 6 Go ou seulement cinq? Eh bien, pour vous dire la vérité, dans toute cette excitation j'ai un peu perdu la trace de moi-même. Mais comme c'est du Perl, le plus puissant de la langue dans le monde, et pourrait faire exploser votre propre mémoire, vous avez obtenu de vous poser une question: j'ai de la chance? Eh bien, pensez-ay, le punk?

Il ya beaucoup plus, mais il est trop tôt dans la matinée pour comprendre ce que ceux qui sont. Je couvre certains en Mastering Perl et Efficace De Programmation Perl.
- Est-il exact que lorsque vous créez une table de hachage Perl ne sera jamais libérer la mémoire utilisée? Pouvez-vous ré-utiliser la même valeur de hachage pour quelque chose d'autre pour économiser de la mémoire?
- IIRC, la mémoire n'est pas communiqué de revenir au programme, mais le programme lui-même réutiliser ce qui a déjà été revendiquée. Par conséquent, si votre hash est hors de portée, alors, vous faites une nouvelle table de hachage, il ne sera probablement utiliser la même mémoire que l'ancien occupé (de nombreuses mises en garde, mais assez proche). Aussi SI ce n'est pas un Perl-problème spécifique, mais, fondamentalement, la façon dont les Systèmes d'exploitation de distribuer de la mémoire de programmes.
- Aussi, je pense Reini Urbain est probablement le gars de demander pour plus de regards sur la réduction de la mémoire des Perling. Commander son techniques de blog si vous l'osez.
- Une démonstration de la mémoire de la réutilisation. perl -E '$|++;while(1){ my $h = {}; say $h; sleep 1}'. Encore une fois c'est plus un argument pour les variables lexicales qu'à l'encontre de la mémoire accaparer. Si votre programme de jamais revendications beaucoup de mémoire à la fois, il va le garder pour la fin.
- Merci pour la réponse. J'ai acheté votre livre comme une suite!!! Je ne suis pas sûr de votre niveau de connaissance de threads en Perl, mais pouvez-vous apporter un aperçu sur le nouveau bounty?
- Oh mon Dieu! C'est brian d foy! Doit ... cliquez ... jusqu'
- "Perl n'a pas de queue à la récursivité d'optimisation" - je pense que c'est ce que goto &foo; ne. Il y a aussi le Sub::Téléphone::Queue module.
- Vous pouvez toujours optimiser vous-même, mais Perl n'est pas qui va le faire pour vous.
- + 1 pour a la recherche de fuites de mémoire. Il est plus facile de fuite en perl que pensent les gens. Puisque vous utilisez un serveur persistant, vous pouvez rencontrer des fuites dans les modules qui n'ont pas trouvé, parce que les auteurs n'avaient exercé dans les plus brefs délais exécuter des scénarios.
- +1 Joli blog sur "carte Mémoire les fichiers au lieu d'aspirer eux".Une petite question, est Fichier::carte de la partie de startdard de l'installation de Perl, si oui, pouvez-vous dire quelle version de Perl est-il?
- Vous pouvez toujours savoir qui d'espaces de noms dans lequel Perl distributions en regardant Module::CoreList
- Je savais que cette liste doit être quelque part: C'est dans le Chapitre 21 de Programmation Perl, et c'est l'une des pièces, j'ai travaillé sur. Oh bien.
- +1 "Ne laissez pas les gens utilisent votre programme. Chaque fois que je l'ai fait, j'ai réduit l'empreinte mémoire d'environ 100%."
InformationsquelleAutor brian d foy
4

Mes deux dimes.
1. Ne threads créés en Perl empêcher la copie module Perl bibliothèques en mémoire pour chaque thread?
  - Il ne le fait pas, c'est juste un processus, ce qui n'est pas répété dans la pile du programme, chaque thread doit
    avoir sa propre.
2. Est fils (fils) le moyen le plus efficace (ou la seule) façon de créer des threads en Perl?
  - OMI Toute méthode appelle éventuellement la bibliothèque pthread Api qui fait réellement le travail.
3. Dans les fils, je peux spécifier un stack_size paramater, que doit-je considérer lors de l'
  la spécification de cette valeur, et quelle est son incidence sur l'utilisation de la mémoire?
  - Depuis threads s'exécute dans le même espace de processus, la pile ne peut pas être partagé. La taille de la pile
    raconte pthreads à quelle distance ils devraient être les uns des autres. Chaque fois qu'une fonction est appelée
    les variables locales sont allouées sur la pile. Si la taille de la pile des limites de profondeur de manière récursive.
    vous pouvez allouer aussi peu que possible de l'étendre que votre application fonctionne toujours.
Avec les threads en Perl/Linux, ce qui est la méthode la plus fiable pour déterminer le montant réel de l'utilisation de la mémoire
sur une base par thread?
```
* Stack storage is fixed after your thread is spawned, heap and static storage is shared and
  they can be used by any thread so this notion of memory usage per-thread doesn't really
  apply. It is per process.


Comparing fork and thread:

* fork duplicate the process and inherites the file handles

  advantages: simpler application logic, more fault tolerant.
              the spawn process can become faulty and leaking resource
              but it will not bring down the parent. good solution if
              you do not fork a lot and the forked process eventually
              exits and cleaned up by the system.

  disadvantages: more overhead per fork, system limitation on the number
              of processes you can fork. You program cannot share variables.

* threads runs in the same process with addtional program stacks.

  advantages: lower memory footprint, thread spawn if faster and ligther
              than fork. You can share variables.

  disadvantages: more complex application logic, serialization of resources etc.
              need to have very reliable code and need to pay attention to
              resource leaks which can bring down the entire application.

IMO, depends on what you do, fork can use way less memory over the life time of the 
application run if whatever you spawn just do the work independently and exit, instead of
risking memory leaks in threads.
```
- Du point de vue d'un réseau de démon, la logique de l'application n'a pas vraiment de changement à tous. En fait, CPAN la "fourche" est construit comme une baisse-dans le remplacement pour cette raison. En outre, au moins sous Linux, bifurquer semble réellement utiliser MOINS de mémoire que les fils ne sont. Les bibliothèques ne semble pas être partagée, et l'utilisation de la mémoire lors de l'utilisation de threads est plus de 2X. Tout cela étant dit, de la pratique, la plupart des tests de votre réponse ne semble pas être en ligne avec mes propres résultats. Qui pourrait être dû à ma propre mise en œuvre et non sur des résultats généraux.
- pour un réseau démon qui écoute juste et spawn hors travail indépendant lorsqu'il y a réception d'une demande, de la fourche a l'avantage d'être très léger et laisser juste la fourche enfant à charge quelles que soient les ressources dont il a besoin et tout ce qui rompt l'enfant n'est pas de faire baisser le démon. Threads est que la peine d'examiner si la connexion entrante fréquence est très élevée et un grand nombre des processus en cours dans le système n'est pas souhaitable.
- Eh bien dans mon cas, il maintient une connexion persistante pendant des heures/jours, rarement engendre une nouvelle fourche. Même si, je n'aurais pas attendu threads à utiliser PLUS de mémoire que les fourches. Je pense qu'il a quelque chose à voir avec le "Copy on Write" modèle de Linux, bien que je me serais attendu à appliquer aussi aux threads.
- J'ai édité le post sur 1 "ne" -> "n'est pas", qui est vraiment ce que je voulais dire.
- la bibliothèque pthread est assez grand et il acquiert ses propres ressources, qui est au-dessus. Dans votre cas, la fourche est le chemin à parcourir, il est propre et fiable, tout simplement pas aussi extensible que les threads.
- Un autre peu d'informations à prendre en compte, si vous frayer hors d'une connexion pour un client avec une fourchette. Il s'exécute dans son propre espace d'adressage. Si vous mettez en œuvre avec pthread, il s'exécute dans le même espace d'adressage pour tout le monde. La chose à considérer ici est la sécurité, whehter vous avez besoin d'un processus distinct pour servir chaque connexion.
- Ok, merci pour l'effort. +150
- Le problème avec cette réponse, c'est qu'elle confond les pthreads (ou, plus correctement, ce qui est appelé fils à l'extérieur de l'Perl monde) avec la soi-disant le biais d'ithreads (windows processus d'émulation) en Perl. Le biais d'ithreads utiliser beaucoup plus de mémoire que la fourche, comme ils sont pratiquement émuler fourche dans le logiciel, de sorte que cette réponse est complètement faux (par exemple, création de thread crée une copie physique du thread appelant, tout à la fourchette, la copie est généralement ce n'est que virtuel, qui est plus rapide). Il n'existe aucun moyen d'utiliser les pthreads directement à partir de Perl. Le plus proche de pthreads (ou "réel threads") en Perl est le Coro, qui sont des fils verts
- Cette réponse, c'est vrai, si vous écrivez programme en C. Mais complètement faux si il est écrit en Perl. avec Perl, toutes les variables sont dupliqués pour le fil, de sorte que tous les threads ont sa propre copie qui prend de la mémoire. La fourche est mieux, parce que, tout simplement en double processus. Après fourche tous les deux processus de données, des bibliothèques, des procédures, des poignées etc sont très partagés. Bloc de mémoire est divisée, lorsque l'un des processus de changement des données dans la mémoire commune bloc. Alors, c'est une grande chance, une fourchette qui va prendre beaucoup moins de mémoire. C'est une bonne idée pour créer de serveur de réseau, de la bonne logique, à titre d'exemple preforked démon apache.
InformationsquelleAutor pizza
2

Si vous êtes vraiment désespéré, vous pourriez essayer de monter la mémoire comme un système de fichiers (tmpfs/ramdisk) et de lire/écrire/supprimer des fichiers sur elle. Je suppose que le tmpfs mise en œuvre est assez intelligent pour libérer de la mémoire lorsque vous supprimez un fichier.

Vous pouvez également mmap (voir Fichier::Map, Sys::Mmap) un énorme fichier sur le tmpfs, une idée que j'ai eu de Cache::FastMmap.

Jamais essayé, mais cela devrait fonctionner 🙂
- Est-ce que avez tout avantage de ne pas utiliser un disque virtuel en RAM, mais l'écriture de fichiers sur le disque? C'est peut-être un peu plus rapide si vous avez lente des disques physiques?
- Il devrait être beaucoup plus rapide! Même si il y a beaucoup de bêtes de charge lorsque l'aide d'opérations optimisé pour les disques sur la mémoire, la ram est beaucoup plus rapide que les disques..
- Btw, sur Linux, ramfs pourrait être un meilleur choix: thegeekstuff.com/2008/11/overview-of-ramfs-and-tmpfs-on-linux en.wikipedia.org/wiki/Ramfs#Linux
- Le problème, c'est que vous êtes toujours à l'aide de la RAM, qui pourrait être la chose que vous essayez d'éviter.
- Oh, ouais.. Suppose que j'ai oublié ce que le sujet a été 😉 L'avantage, c'est (j'espère) que si vous supprimez un fichier à partir du disque ram le système d'exploitation libre de la mémoire. Disons que vous créez de 1 go de données dans un long processus en cours d'exécution. Au lieu de les stocker dans une table de hachage, vous l'écrire dans un fichier et mmap il. Lorsque vous n'avez pas besoin de données plus vous rm le fichier et obtenir le secours de la mémoire.
InformationsquelleAutor Øyvind Skaar
2

En plus de brian d foy les suggestions, j'ai trouvé le suivant aussi BEAUCOUP aidé.
1. Si possible, ne pas "utiliser" des modules externes, vous ne savez pas combien de mémoire qu'ils utilisent. J'ai trouvé par le remplacement de la LWP et HTTP::Request::Common des modules avec Curl ou de Lynx réduit l'utilisation de la mémoire par la moitié.
2. Réduit de nouveau en modifiant nos propres modules et en tirant dans seules les sous-programmes à l'aide de "besoin" plutôt que d'une bibliothèque complète de inutiles subs.
3. Brian mentionne l'utilisation de variables lexicales avec le plus petit de la portée. Si vous êtes à la bifurcation, à l'aide de "undef" permet également de par immédiatement libérer de la mémoire pour Perl pour le ré-utiliser. Vous déclarez donc un scalaire, tableau, hachage ou même des sous, et lorsque vous avez terminé, utilisez :
  
  ma (@divs) = localtime(time);
  $VAR{minute} = $divs[1];
  
  le fnud @divs;
  le fnud @tableau;
  undef $scalaire;
  le fnud %hash;
  le fnud &sous;
4. Et ne pas utiliser n'importe quel unnecssary variables pour rendre votre code plus petits. Il est préférable de coder tout ce qui est possible pour réduire l'espace de noms d'utilisation.
Puis, il y a un tas d'autres trucs que vous pouvez essayer selon les fonctionnalités de votre application. Le nôtre a été exécuté par cron toutes les minutes. Nous avons constaté que nous pourrions fourche à la moitié du processus avec un sleep(30), de sorte moitié exécuter et terminer dans les 30 premières secondes, libérant ainsi de la cpu et de la mémoire, et l'autre moitié de courir après un délai de 30 secondes. Réduit de moitié l'utilisation des ressources à nouveau. Tous, nous avons réussi à réduire l'utilisation de la RAM de plus de 2 GO en bas à 200 mo, une économie de 90%.

Nous avons réussi à obtenir une assez bonne idée de l'utilisation de la mémoire avec
```
top -M
```
que notre script a été exécuté sur une relativement stable serveur avec un seul site. Donc, regarder "ram libre" nous a donné une assez bonne indication de memery utilisation.

Aussi "ps" grepping pour votre script, et si fourches, de tri, soit par la mémoire ou de l'utilisation de l'uc a été d'une bonne aide.
```
ps -e -o pid,pcpu,pmem,stime,etime,command --sort=+cpu | grep scriptname | grep -v grep
```
InformationsquelleAutor Y.K.
1

Les deux fils et la fourche sera CoW (Copy on Write) pages de mémoire. Avec les threads, vous pouvez défini des variables partagées, mais par défaut de copie vos variables par sujet. Dans les deux cas, vous pouvez vous attendre à une plus grande utilisation de la mémoire.

Je ne sais pas exactement quel type de demande que vous faites affaire avec, mais vous pouvez envisager d'écrire votre Application à l'aide Événement Piloté par le modèle au lieu de Parent/Enfant de processus. Je vous recommande de prendre un coup d'oeil à AnyEvent c'est assez simple, et compte tenu de l'application devient thread unique ( ou processus ), vous allez économiser de la mémoire (et encore plus vite dans certains cas). Les gens même écrit des serveurs avec AnyEvent avec de très bonnes performances et vous pourriez presque pas remarqué qu'il est mono-thread. Jetez un oeil par exemple à Twiggy
- Cela dépend vraiment de la quantité de temps que je veux passer de l'écriture d'un réseau démon, ainsi que la méthode de déploiement. - Je trouver un bon événement piloté par le modèle prend plus de temps pour écrire. Je n'étais pas au courant de tous les modules pour les aider à faire ça, donc merci pour la réponse.
- Perl fils le plus certainement ne PAS faire de Vache chaque perl "thread" qui est créé est une véritable "physique" de la copie.
InformationsquelleAutor bluescreen
-7

Essayez d'utiliser plus de la mise en cache. La logique de la mise en œuvre de la mise en cache de routine est toujours la même, de sorte que vous pouvez automatiser à l'aide de module CPAN Memoize. Utilisation Devel::Taille pour vérifier la quantité de mémoire.
- La mise en cache va augmentation votre empreinte mémoire.
- Sera la mise en cache toujours augmenter la mémoire empreintes? ou des certains cas précis?. Je crois pré-calcul de fonctionnement comme la construction de look-up table, etc devraient réduire les coûts et d'accélérer l'opération.
- Si vous êtes économiser de choses en mémoire, vous êtes à l'aide de la mémoire. La vitesse n'est pas la question. Habituellement, votre négociation de la vitesse de la mémoire. Plus on est de moins en moins de l'autre.
- J'ai aussi (surtout) en désaccord avec la réponse: cependant, il pourrait y avoir un cas où la mise en cache sauve la journée: en mettant en cache les résultats de récursive des sous.
- les modules de cache forces de malloc. Il faut de la mémoire du système, jusqu'à ce script va mourir/de sortie.
InformationsquelleAutor ppant

Vous devez vous connecter pour publier un commentaire.