Node.js: Comment faire pour lire un flux de données dans une mémoire tampon?

J'ai écrit un assez simple fonction qui télécharge une image à partir d'une URL donnée, de les redimensionner et de les télécharger pour les S3 (à l'aide de 'g' et 'knox), je n'ai aucune idée de si je suis en train de faire la lecture d'un flux vers une mémoire tampon correctement. (tout fonctionne, mais est-ce la bonne voie?)

aussi, je veux comprendre quelque chose au sujet de la boucle d'événements, comment puis-je savoir qu'une invocation de la fonction ne sera pas de fuite de quelque chose ou de changer le 'buf' variable à une autre déjà en cours d'exécution invocation (ou ce scénario est impossible, car les rappels sont des fonctions anonymes?)

var http = require('http');
var https = require('https');
var s3 = require('./s3');
var gm = require('gm');
module.exports.processImageUrl = function(imageUrl, filename, callback) {
var client = http;
if (imageUrl.substr(0, 5) == 'https') { client = https; }
client.get(imageUrl, function(res) {
if (res.statusCode != 200) {
return callback(new Error('HTTP Response code ' + res.statusCode));
}
gm(res)
.geometry(1024, 768, '>')
.stream('jpg', function(err, stdout, stderr) {
if (!err) {
var buf = new Buffer(0);
stdout.on('data', function(d) {
buf = Buffer.concat([buf, d]);
});
stdout.on('end', function() {
var headers = {
'Content-Length': buf.length
, 'Content-Type': 'Image/jpeg'
, 'x-amz-acl': 'public-read'
};
s3.putBuffer(buf, '/img/d/' + filename + '.jpg', headers, function(err, res) {
if(err) {
return callback(err);
} else {
return callback(null, res.client._httpMessage.url);
}
});
});
} else {
callback(err);
}
});
}).on('error', function(err) {
callback(err);
});
};

InformationsquelleAutor Gal Ben-Haim | 2013-01-10

node.js

70

Globalement, je ne vois pas ce qui allait se briser dans votre code.

Deux suggestions:

La façon dont vous combinez Buffer objets est une sous-optimale car il a copier toutes les données déjà existantes sur tous les "données" de l'événement. Il serait mieux de mettre les morceaux dans un tableau et concat tous à la fin.
```
var bufs = [];
stdout.on('data', function(d){ bufs.push(d); });
stdout.on('end', function(){
var buf = Buffer.concat(bufs);
}
```
Pour la performance, je veux le regarder dans si le S3 bibliothèque que vous utilisez prend en charge les flux. Idéalement, vous n'avez pas besoin de créer une grande mémoire tampon à tous, et, au lieu de simplement passer les stdout flux directement vers le S3 bibliothèque.

Comme pour la deuxième partie de votre question, ce n'est pas possible. Lorsqu'une fonction est appelée, elle est allouée à son propre contexte, et tout ce que définies à l'intérieur de qui sera uniquement accessible à partir d'autres éléments définis à l'intérieur de cette fonction.

Mise à jour

Dumping le fichier du système de fichiers signifierait probablement moins de l'utilisation de la mémoire par la demande, mais le fichier IO peut être assez lent, il pourrait ne pas être en vaut la peine. Je dirais que vous ne devriez pas optimiser trop jusqu'à ce que vous pouvez le profil et le stress-test de cette fonction. Si le garbage collector est en train de faire son travail, vous pouvez être overoptimizing.

Avec tout ce que dit, il existe de meilleures façons de toute façon, donc ne l'utilisez pas les fichiers. Depuis tout ce que vous voulez est de la longueur, vous pouvez calculer que, sans avoir besoin d'ajouter tous les tampons ensemble, alors vous n'avez pas besoin d'allouer un nouveau Tampon à tous.
```
var pause_stream = require('pause-stream');
//Your other code.
var bufs = [];
stdout.on('data', function(d){ bufs.push(d); });
stdout.on('end', function(){
var contentLength = bufs.reduce(function(sum, buf){
return sum + buf.length;
}, 0);
//Create a stream that will emit your chunks when resumed.
var stream = pause_stream();
stream.pause();
while (bufs.length) stream.write(bufs.shift());
stream.end();
var headers = {
'Content-Length': contentLength,
//...
};
s3.putStream(stream, ....);
```
- il prend en charge les flux, mais j'ai besoin de connaître la Longueur du Contenu pour le S3 en-têtes et de son impossible avec des cours d'eau
- btw - ce que sur la deuxième partie de la question ?
- Ah oui! Mis à jour.
- est-il préférable de canaliser le flux de " gm " pour un fichier, puis ouvrir un flux à partir de ce fichier et le télécharger à S3, à l'aide de la taille du fichier en tant que Content-Length ? autant je comprends ceci élimine le chargement de la totalité du fichier de la mémoire comme je le fais maintenant
- Mis à jour.
- je veux juste mentionner que le bufs.pop() appel doit être bufs.unshift(), ou encore plus simple il suffit de remplacer la totalité de la boucle while avec une simple boucle for.
- sur l' ("données"), vous pouvez simplement faire octets += data.longueur au lieu de réduire le tableau à la fin.
- Vrai, mais alors vous devez maintenir deux accumulateur variables. Je préfère le maintien de la seule et calcul de la longueur de la plus tard. Je ne suis pas convaincu que cela ferait une différence sensible de la performance ou de quoi que ce soit.
- Génial...Ses vraiment aidé @oganfsmyth
InformationsquelleAutor loganfsmyth
6

Vous pouvez facilement le faire en utilisant nœud-extraction si vous êtes en tirant à partir de l'adresse http(s) Uri.

Du readme:
```
fetch('https://assets-cdn.github.com/images/modules/logos_page/Octocat.png')
.then(res => res.buffer())
.then(buffer => console.log)
```
InformationsquelleAutor Tiberiu-Ionuț Stan
4

Un projet connexe est nœud-stream-tampon. Description: "de lecture et d'Écriture des Ruisseaux que l'utilisation de la sauvegarde des Tampons".
- À partir du package de fichier lisez-moi: "Pas censé être un démon de la vitesse, c'est plus pour les tests de débogage ou de l'étrange cas de bord. Il fonctionne avec une mémoire tampon interne qu'il copie le contenu de/de/autour."
InformationsquelleAutor Felix Rabe
1

Je suggère de tableau de tampons et concat résultant de la mémoire tampon qu'une seule fois à la fin. Il est facile de le faire manuellement, ou que l'on pourrait utiliser nœud-tampons

InformationsquelleAutor Andrey Sidorov

Je veux juste poster ma solution. Réponse à la question précédente a été très utile pour mes recherches. J'utilise la longueur de cours d'eau pour obtenir la taille de la rivière, mais le problème ici est que le rappel est tiré près de la fin du flux, donc, j'utilise aussi les flux cache à cache le flux et le tuyau à res objet une fois que je connais la longueur du contenu. En cas d'erreur,

var StreamCache = require('stream-cache');
var lengthStream = require('length-stream');
var _streamFile = function(res , stream , cb){
var cache = new StreamCache();
var lstream = lengthStream(function(length) {
res.header("Content-Length", length);
cache.pipe(res);
});
stream.on('error', function(err){
return cb(err);
});
stream.on('end', function(){
return cb(null , true);
});
return stream.pipe(lstream).pipe(cache);
}

InformationsquelleAutor Angelos Veglektsis

Je suggère loganfsmyths méthode, à l'aide d'un tableau pour stocker les données.

var bufs = [];
stdout.on('data', function(d){ bufs.push(d); });
stdout.on('end', function(){
var buf = Buffer.concat(bufs);
}

DANS mon exemple, je travaille avec GRIDfs et des mnp Jimp.

   var bucket = new GridFSBucket(getDBReference(), { bucketName: 'images' } );
var dwnldStream = bucket.openDownloadStream(info[0]._id);//original size
dwnldStream.on('data', function(chunk) {
data.push(chunk);
});
dwnldStream.on('end', function() {
var buff =Buffer.concat(data);
console.log("buffer: ", buff);
jimp.read(buff)
.then(image => {
console.log("read the image!");
IMAGE_SIZES.forEach( (size)=>{
resize(image,size);
});
});

J'ai fait d'autres recherches

avec une méthode de chaîne mais cela ne fonctionne pas, par pad parce que j'ai été la lecture d'un fichier image, mais la méthode de la baie a fait un travail.

const DISCLAIMER = "DONT DO THIS";
var data = "";
stdout.on('data', function(d){ 
bufs+=d; 
});
stdout.on('end', function(){
var buf = Buffer.from(bufs);
////do work with the buffer here
});

Quand j'ai fait la méthode de chaîne j'ai eu cette erreur de mnp jimp

buffer:  <Buffer 00 00 00 00 00>
{ Error: Could not find MIME for Buffer <null>

fondamentalement, je crois que le type encore de la contrainte de binaire en chaîne ne fonctionne pas si bien.

InformationsquelleAutor Maddocks

Vous devez vous connecter pour publier un commentaire.

Mise à jour