R et le contrôle de version pour le solo, analyste de données

De nombreux analystes de données que je respecte utiliser le contrôle de version.
Par exemple:

Cependant, je suis d'évaluer si l'adoption d'un système de contrôle de version comme git serait utile.

Un bref aperçu:
Je suis un chercheur en sciences sociales qui utilise R pour analyser les données de publications de recherche.
Je ne suis pas actuellement de produire des packages R.
Mon R code pour un projet comprend généralement quelques milliers de lignes de code pour l'entrée des données, le nettoyage, la manipulation, l'analyse et la génération de sortie.
Les Publications sont généralement écrites à l'aide de LaTeX.

En ce qui concerne le contrôle de version il y a de nombreux avantages que j'ai lu, pourtant, ils semblent être moins pertinentes pour le solo de données analyste.

  • Sauvegarde: j'ai une sauvegarde du système déjà en place.
  • la Fourche et le rembobinage: je n'ai jamais ressenti le besoin de le faire,
    mais je peux voir comment cela pourrait être utile (par exemple, vous préparez plusieurs
    journal des articles basés sur le même ensemble de données; de la préparation d'un rapport
    qui est mise à jour mensuellement, etc)
  • la Collaboration: la Plupart du temps, je suis
    l'analyse des données moi-même, donc, je
    ne pas obtenir la collaboration
    les prestations de contrôle de version.

Il y a aussi plusieurs coûts potentiellement impliqués dans l'adoption de contrôle de version:

  • Le temps d'évaluer et d'en apprendre un système de contrôle de version
  • Une possible augmentation de la complexité sur mon fichier actuel système de gestion de la

Cependant, j'ai toujours le sentiment qu'il me manque quelque chose.
Guides généraux sur la version de contrôle semblent être abordée de plus en plus vers des informaticiens que des analystes de données.

Ainsi, spécifiquement par rapport à d'analystes de données dans des circonstances semblables à celles énumérées ci-dessus:

  1. Est la version de contrôle de la valeur de l'effort?
  2. Quels sont les principaux avantages et inconvénients de l'adoption de contrôle de version?
  3. Ce qui est une bonne stratégie pour prendre en main le contrôle de version
    pour l'analyse de données avec R (p. ex., exemples, idées de flux de travail, des logiciels, des liens vers des guides)?
  • Avez-vous lu ceci: stackoverflow.com/questions/360887/...
  • Ce post est utile. Merci beaucoup. Je voudrais encore savoir quelles questions précises, le cas échéant, se rapportent à l'analyse des données, R, et l'écriture de la recherche.
  • La réponse à votre première question est "oui", bien sûr. Mais quel type/taille de données avez-vous l'habitude de manipuler. La plupart des CV de systèmes ont un moment difficile de stocker des données binaires.
  • Vous pouvez aussi regardez ceci: stackoverflow.com/questions/2286831/...
  • Je travaille avec un mélange de texte (p. ex., délimités par des tabulations, largeur fixe) et binaire (bases de données, SPSS, Excel, etc.) les fichiers. Les données varient: des exemples Typiques de 100 lignes x 500 colonnes à 10 000 x 20 à 2 000 000 x 20.
  • Merci Shane pour me montrer la poste existant sur le contrôle de version et R. j'estime qu'avant de poster.