Mémoire alternative efficace à rbind en place rbind?

J'ai besoin de rbind deux grandes trames de données. Maintenant j'utilise

df <- rbind(df, df.extension)

mais j'ai (presque) instantanément à court de mémoire. Je suppose que c'est parce que df est tenu à la mémoire de deux fois. Je pourrais voir encore plus grand des trames de données à l'avenir, j'ai donc besoin d'une sorte de place rbind.

Donc ma question est: Est-il un moyen d'éviter la duplication des données dans la mémoire lors de l'utilisation de rbind?

J'ai trouvé ce question, qui utilise SqlLite, mais je veux vraiment éviter d'utiliser le disque dur comme mémoire cache.

  • êtes-vous payer? Si oui, pouvez-vous acheter pour moi aussi? 😉
  • Si je travaillais pour moi il serait payer pour lui-même dans l'augmentation de la productivité, et quand j'ai posé cet argument à mon employeur actuel, il a été accepté comme un "business case".
  • Deux questions: 1: j'ai appris que (re)codage de temps nécessite un TARDIS. 2: au-Delà d'un particulier sweet spot, c'est mieux pour la mémoire de la carte que pour obtenir plus de RAM. Souvent, la fonction objectif pour le CHP est multidimensionnelle.
  • Dites-nous les dimensions des deux dfs. Semble comme object.size(df) >> object.size(df.extension), droit? Aussi, pouvons-nous supposer que leurs deux colonnes sont identiques en nombre, le nom, le type, le taux de facteur? donc, nous n'avons pas besoin de vérifier, remplissez les colonnes manquantes, NAs etc?
InformationsquelleAutor Sebastian | 2011-08-17