Comment faire pour supprimer/supprimer un fichier volumineux à partir de commettre l'histoire dans le dépôt Git?

Parfois j'ai laissé tomber un DVD-rip dans un projet de site web, négligemment git commit -a -m ..., et, zap, les pensions de titres a été gonflé par 2.2 concerts. La prochaine fois, j'ai fait quelques modifications, supprimé le fichier vidéo, et engage tout, mais le fichier compressé est toujours là dans le référentiel, dans l'histoire.

Je sais que je peux commencer les branches de ces validations et rebase une branche à l'autre. Mais que dois-je faire pour fusionner les 2 s'engage pour que les gros fichier n'apparaît pas dans l'histoire et ont été nettoyés dans la collecte des ordures procédure?

Cet article devraient vous aider help.github.com/removing-sensitive-data
Connexes: supprimer Complètement fichier de tous les dépôts Git commit l'histoire.
Notez que si votre fichier de grande taille est dans un sous répertoire, vous devez spécifier le chemin d'accès relatif.
connexes help.github.com/articles/...
Également lié help.github.com/en/articles/...

InformationsquelleAutor culebrón | 2010-01-20

506

Utiliser le BFG Repo-Cleaner, plus simple, plus rapide, alternative à git-filter-branch spécialement conçu pour supprimer les fichiers d'historique de Git.

Suivez attentivement les les instructions d'utilisation, la partie centrale est simplement ceci:
```
$ java -jar bfg.jar --strip-blobs-bigger-than 100M my-repo.git
```
Tout les fichiers de plus de 100 mo (qui ne sont pas dans votre dernière commettre) sera supprimé de votre dépôt Git de l'histoire. Vous pouvez ensuite utiliser git gc pour nettoyer la mort des données:
```
$ git gc --prune=now --aggressive
```
Le BFG est habituellement d'au moins 10-50x plus rapide que la course git-filter-branch, et généralement plus facile à utiliser.

Divulgation complète: je suis l'auteur de la BFG Repo-Cleaner.
- J'ai suivi les instructions d'utilisation sur le site en faisant un clone --miroir. Quand il est venu le temps de pousser le repo, il a échoué en indiquant que j'avais besoin de tirer en premier. Je suis assez sûr qu'il n'y a eu aucun s'engage entre le moment où je clone et le repousser. Si je tire, git se plaint qu'il a besoin d'un arbre de travail à l'intérieur de mon-repo.git. Toutes les suggestions?
- Il vaut la peine de répéter l'ensemble du clonage & la procédure de clarification pour voir si le message vous demandant de tirer re-produit, mais il est presque certainement parce que votre serveur distant est configuré pour rejeter les non-avance rapide des mises à jour (c'est à dire, il est configuré de manière à vous empêcher de perdre de l'histoire - ce qui est exactement ce que vous voulez faire). Vous avez besoin d'obtenir que le réglage modifié sur la télécommande, ou, à défaut, de pousser la mise à jour de pensions de l'histoire de la marque nouvelle repo.
- Merci. J'ai essayé 3 différents temps et de tous les a entraîné avec le même message. Donc, je pense aussi que tu as raison sur le serveur distant est configuré pour rejeter les non-avance rapide des mises à jour. Je vais envisager de simplement pousser la mise à jour de repo à un tout nouveau repo. Merci!!!!
- Parfait, vous économiser de mon temps, merci beaucoup. Par la manière, peut-être devraient faire git push --force après vos étapes, sinon la télécommande repo toujours pas changé.
- +1 pour l'ajout de git push --force. Aussi à noter: la force de pousse ne peut pas être admis par la télécommande (gitlab.com n'est pas, par défaut. Avait à "ôter la protection de" la branche).
- Au lieu de --strip-blobs-bigger-than 100M vous pouvez également utiliser -b 100M en fonction de l'aide.
- Vous ne savez pas si BFG supprime automatiquement le reflog références... si non, vous avez encore besoin de courir: git reflog expire --expire-unreachable=all comme décrit par @Greg Bacon dans sa réponse ici. Si il y a encore reflog les entrées, les données ne seront pas supprimés par git gc, même avec aggressive (apparemment il y a des limites à son agressivité)
- Astuce: Si vous exécutez bfg.jar avec le fichier déclarée .gitignore, il ne sera pas supprimé.
- BFG doit réécrire l'histoire pour faire ce qu'il fait, essentiellement la création d'un tout nouveau commit arbre. Ce, par définition, signifie que les commits d'obtenir de nouvelles sha1 hachages c'est pourquoi la force de poussée est nécessaire, comme le parent n'est plus ce que le serveur attend. Normalement, c'est un BON chose, mais dans ce cas particulier, nous en savons plus.
- J'ai une question d'ordre général, est BFG également fonctionnel sur Windows aussi bien que sur Linux/Mac?
- oui, il fonctionne sur toute plate forme Java 7 ou supérieur installé. Vous pouvez télécharger Java pour Windows ici: java.com/en/download
- BFG a travaillé un charme absolu pour moi. Apporté une 517mb pension de 38 Mo en seulement quelques minutes. Rien d'autre n'a fonctionné pour moi avant de trouver cette réponse.
- Sans-papiers problème (pour la plupart) lors d'une "est repo paniers d'erreur". Utilisation git gc sur la cible repo, puis exécutez de nouveau que ce que vous faisiez avec BFG. Une fois trié assez bien travaillé. Pourrait utiliser plus de documentation explicite, mais alors je ne suis pas le moyen le plus rapide de l'apprenant ;p
- Comment voulez-vous installer ce genre de choses? brew install bfg me donne Warning: bfg 1.12.15 is already installed ok: $ java -jar bfg.jar --strip-blobs-bigger-than 1M myrepo.git j'obtiens: Error: Unable to access jarfile bfg.jar
- Merci pour l'astuce) cette question: does the repo need to be packed? certainement, doivent être documentées.
- +1 pour BFG, j'ai essayé le "standard" à l'aide de la méthode filter-branch et il est BEAUCOUP plus lent et dans mon cas, il n'a pas supprimé toutes les références pour les gros fichiers...
- Je pense que l'Atout le jargon de l'outil de production est un peu beaucoup.
- qu'est-ce que myrepo.git?
- À votre sortie, vous dites que nous devrions exécuter git reflog expire --expire=now --all && git gc --prune=now --aggressive
- Est-il un moyen de supprimer les "Ex-commit-id" de tous les commet?
- La branche principale est à l'abri de la pousse. Sera fonctionne comme prévu à partir de private branch et PR de maître?
InformationsquelleAutor Roberto Tyley
510

Ce que vous voulez faire est très perturbatrice si vous avez publié l'histoire à d'autres développeurs. Voir “La récupération De l'Amont Rebase” dans le git rebase de la documentation pour les mesures nécessaires après la réparation de votre histoire.

Vous avez au moins deux options: git filter-branch et un rebase interactif, à la fois expliqués ci-dessous.

À l'aide de git filter-branch

J'ai eu un problème similaire avec les encombrants binaire des données de test à partir d'un import de Subversion et écrit à propos de suppression des données d'un dépôt git.

Dire que votre historique de git est:
```
$ git lola --name-status
* f772d66 (HEAD, master) Login page
| A     login.html
* cb14efd Remove DVD-rip
| D     oops.iso
* ce36c98 Careless
| A     oops.iso
| A     other.html
* 5af4522 Admin page
| A     admin.html
* e738b63 Index
  A     index.html
```
Noter que git lola est un non-standard, mais très utile alias. Avec le --name-status interrupteur, on peut voir l'arbre des modifications associées à chaque commit.

Dans le “Négligent” commit (dont SHA1 nom de l'objet est ce36c98) le fichier oops.iso est le DVD-rip ajouté par accident et retiré dans le prochain commit, cb14efd. À l'aide de la technique décrite dans le blog précité, la commande à exécuter est:
```
git filter-branch --prune-empty -d /dev/shm/scratch \
  --index-filter "git rm --cached -f --ignore-unmatch oops.iso" \
  --tag-name-filter cat -- --all
```
Options:
- --prune-empty supprime s'engage à ce que deviennent vides (c'est à dire, ne modifiez pas l'arbre) comme résultat de l'opération de filtrage. Dans le cas typique, cette option produit un nettoyeur de l'histoire.
- -d noms un répertoire temporaire qui n'existe pas encore à utiliser pour la construction de l'filtré de l'histoire. Si vous êtes en cours d'exécution sur une distribution Linux moderne, la spécification d'un arbre dans /dev/shm sera plus rapide d'exécution.
- --index-filter est le principal événement et va à l'encontre de l'index à chaque étape de l'histoire. Vous souhaitez supprimer oops.iso partout où il se trouve, mais il n'est pas présent dans tous les commits. La commande git rm --cached -f --ignore-unmatch oops.iso supprime le DVD-rip quand il est présent et ne manque pas autrement.
- --tag-name-filter décrit comment réécrire les noms de balise. Un filtre de cat est l'identité de l'opération. Votre référentiel, comme l'exemple ci-dessus, peuvent ne pas avoir toutes les étiquettes, mais j'ai inclus cette option pour tous les cas.
- -- spécifie la fin des options de git filter-branch
- --all suivantes -- est un raccourci pour toutes les refs. Votre référentiel, comme l'exemple ci-dessus, ne peut avoir qu'un ref (master), mais j'ai inclus cette option pour tous les cas.
Après quelques barattage, l'histoire est maintenant:
```
$ git lola --name-status
* 8e0a11c (HEAD, master) Login page
| A     login.html
* e45ac59 Careless
| A     other.html
| * f772d66 (refs/original/refs/heads/master) Login page
| | A   login.html
| * cb14efd Remove DVD-rip
| | D   oops.iso
| * ce36c98 Careless
|/
|   A   oops.iso
|   A   other.html
* 5af4522 Admin page
| A     admin.html
* e738b63 Index
  A     index.html
```
Avis que la nouvelle “Négligent” commettre ajoute seulement other.html et que le “Supprimer DVD-rip” commit n'est plus sur la branche master. La direction de la étiquetés refs/original/refs/heads/master contient votre original s'engage, dans le cas où vous faites une erreur. Pour l'enlever, suivez les étapes décrites dans “Liste de contrôle pour la réduction d'un Référentiel”.
```
$ git update-ref -d refs/original/refs/heads/master
$ git reflog expire --expire=now --all
$ git gc --prune=now
```
Pour une solution plus simple, cloner le dépôt débarrasser de l'indésirable bits.
```
$ cd ~/src
$ mv repo repo.old
$ git clone file:///home/user/src/repo.old repo
```
À l'aide d'un file:///... clone URL copies des objets plutôt que de créer des liens physiques uniquement.

Maintenant, votre histoire est:
```
$ git lola --name-status
* 8e0a11c (HEAD, master) Login page
| A     login.html
* e45ac59 Careless
| A     other.html
* 5af4522 Admin page
| A     admin.html
* e738b63 Index
  A     index.html
```
Le SHA1 les noms d'objet pour les deux premiers commits (“Index” et “page d'administration”) est resté le même, parce que l'opération de filtrage ne modifiez pas ces validations. “Négligent” perdu oops.iso et “page de Connexion” vous avez un nouveau parent, de sorte que leur SHA1s ne changement.

Rebase interactif

Avec une histoire de:
```
$ git lola --name-status
* f772d66 (HEAD, master) Login page
| A     login.html
* cb14efd Remove DVD-rip
| D     oops.iso
* ce36c98 Careless
| A     oops.iso
| A     other.html
* 5af4522 Admin page
| A     admin.html
* e738b63 Index
  A     index.html
```
vous souhaitez supprimer oops.iso de “Négligent” comme si vous n'avez jamais ajouté, puis “Supprimer DVD-rip” est inutile pour vous. Ainsi, notre plan est d'entrer dans un rebase interactif est de garder “l'Admin de la page, puis” modifier “Négligents”, et jeter “Supprimer DVD-rip.”

De course $ git rebase -i 5af4522 commence un éditeur de texte avec le contenu suivant.
```
pick ce36c98 Careless
pick cb14efd Remove DVD-rip
pick f772d66 Login page

# Rebase 5af4522..f772d66 onto 5af4522
#
# Commands:
#  p, pick = use commit
#  r, reword = use commit, but edit the commit message
#  e, edit = use commit, but stop for amending
#  s, squash = use commit, but meld into previous commit
#  f, fixup = like "squash", but discard this commit's log message
#  x, exec = run command (the rest of the line) using shell
#
# If you remove a line here THAT COMMIT WILL BE LOST.
# However, if you remove everything, the rebase will be aborted.
#
```
L'exécution de notre plan, nous le modifier à
```
edit ce36c98 Careless
pick f772d66 Login page

# Rebase 5af4522..f772d66 onto 5af4522
# ...
```
Qui est, nous supprimer la ligne avec “Supprimer DVD-rip” et de modifier l'opération sur le “Négligent” pour être edit plutôt que pick.

Enregistrez-la fermeture de l'éditeur de nous dépose à une invite de commandes avec le message suivant.
```
Stopped at ce36c98... Careless
You can amend the commit now, with

        git commit --amend

Once you are satisfied with your changes, run

        git rebase --continue
```
Que le message nous dit, nous sommes sur la “Négligent” engageons nous voulons modifier, afin de nous exécuter deux commandes.
```
$ git rm --cached oops.iso
$ git commit --amend -C HEAD
$ git rebase --continue
```
La première supprime le fichier avi à partir de l'index. Le second modifie ou modifie “Négligent” à la mise à jour de l'index et -C HEAD indique à git pour réutiliser les vieux message de commit. Enfin, git rebase --continue va de l'avant avec le reste de la rebase opération.

Cela donne une histoire de:
```
$ git lola --name-status
* 93174be (HEAD, master) Login page
| A     login.html
* a570198 Careless
| A     other.html
* 5af4522 Admin page
| A     admin.html
* e738b63 Index
  A     index.html
```
qui est ce que vous voulez.
- Pourquoi je ne peux pas pousser lors de l'utilisation de git filter-branch, a échoué à pousser quelques références à "[email protected]:product/myproject.git" Pour vous éviter de perdre de l'histoire, non de l'avance rapide des mises à jour ont été rejetées Fusionner les modifications distantes avant de pousser à nouveau.
- Ajouter le -f (ou --force) option pour votre git push commande: “Généralement, la commande refuse de mettre à jour à distance ref qui n'est pas un ancêtre de la locale ref utilisé pour le remplacer. Ce drapeau désactive la vérification. Cela peut entraîner le dépôt distant à perdre s'engage; utiliser avec prudence.”
- C'est une merveille approfondie réponse expliquant l'utilisation de git-filter-branch pour supprimer les fichiers volumineux à partir de l'histoire, mais il est intéressant de noter que, depuis Greg a écrit sa réponse, Le BFG Repo-Cleaner a été libéré, ce qui est souvent plus rapide et plus facile à utiliser, voir ma réponse pour plus de détails.
- Après je ne l'une des procédures ci-dessus, le dépôt distant (sur GitHub) ne supprime PAS le fichier de grande taille. Seul le local n'. Je me force à pousser et nada. Ce qui me manque?
- cela fonctionne aussi sur dirs. ... "git rm --cached -rf --ignore-unmatch path/to/dir"...
- Je ne peux pas il suffit de supprimer "pick cb14efd Supprimer DVD-rip" ligne de cause "Supprimer DVD-rip" commit j'ai fait quelques autres choses. (en Rebase Interactif solution)
- Dans votre cas, marquer à la fois s'engage avec edit et nettoyer à la main dans le shell.
InformationsquelleAutor Greg Bacon
150

Pourquoi ne pas utiliser cette simple mais puissante de commande?
```
git filter-branch --tree-filter 'rm -f DVD-rip' HEAD
```
La --tree-filter option exécute la commande spécifiée après chaque checkout du projet, puis engage à nouveau les résultats. Dans ce cas, vous supprimez un fichier appelé DVD-rip de chaque photo, si elle existe ou pas.

Voir ce lien.
- C'est une bonne solution! J'ai créé un résumé qui a un script python pour afficher la liste des fichiers & git cmd qui va supprimer le fichier que vous voulez nettoyer gist.github.com/ariv3ra/16fd94e46345e62cfcbf
- Beaucoup mieux que la bfg. J'ai été incapable de nettoyer le fichier à partir d'un git avec bfg, mais cette commande aidé
- Ce qui est excellent. Juste une remarque pour les autres que vous aurez à le faire par branche si le gros fichier en plusieurs branches.
- Sur Windows j'ai eu fatal: bad revision 'rm', que j'ai fixé en utilisant " au lieu de '. Ensemble de commande: git filter-branch --force --index-filter "git rm --cached -r --ignore-unmatch oops.iso" --prune-empty --tag-name-filter cat -- --all
- Aussi, ma commande n'a pas fonctionné lors de l'utilisation de \ comme séparateur de chemin - être même sur Windows. J'ai eu à utiliser /.
- Cela a fonctionné pour moi sur un local de s'engager à ce que je ne pouvais pas télécharger sur GitHub. Et il semblait plus simple que les autres solutions.
- Cela a fonctionné pour moi, lorsque le filtre de la branche n'a pas
- Tout cela ne fait pour moi, c'est la création d'un immense .git-rewrite répertoire tout en gardant les fichiers supprimés dans le repo.
- Cela aussi n'a pas fonctionné pour moi? Toutes les autres pensées
- Si vous connaissez les commit où vous placez le fichier dans (dire 35dsa2), vous pouvez remplacer HEAD avec 35dsa2..HEAD. tree-filter est beaucoup plus lent que index-filter que la façon dont il l'habitude d'essayer de les extraire tous les commits et les réécrire. si vous utilisez la TÊTE, il va essayer de le faire.
- J'ai essayé et ont maintenant "de Votre branche et 'origin/master' ont divergé, et de 49 et 44 s'engage chacun, respectivement."
- semble que c'est la meilleure option.
InformationsquelleAutor Gary Gauh
55

(La meilleure réponse que j'ai vu à ce problème est: https://stackoverflow.com/a/42544963/714112 , copié ici depuis ce fil semble élevé dans les classements de recherche de Google, mais que d'autres n'en ont pas),

Extrêmement rapides shell one-liner

Ce script shell affiche tous les objets blob dans le référentiel, triées de la plus petite à la plus grande.

Pour mon exemple, repo, il a couru sur 100 fois plus rapide que les autres qui se trouvent ici.

Sur mon fidèle Athlon II X4 système, il gère le Noyau Linux référentiel avec ses 5,622,155 objets dans peu plus d'une minute.

La Base De Script
```
git rev-list --objects --all \
| git cat-file --batch-check='%(objecttype) %(objectname) %(objectsize) %(rest)' \
| awk '/^blob/{print substr($0,6)}' \
| sort --numeric-sort --key=2 \
| cut --complement --characters=13-40 \
| numfmt --field=2 --to=iec-i --suffix=B --padding=7 --round=nearest
```
Lorsque vous exécutez le code ci-dessus, vous obtiendrez de nice lisible par l'homme de sortie comme ceci:
```
...
0d99bb931299  530KiB path/to/some-image.jpg
2ba44098e28f   12MiB path/to/hires-image.png
bd1741ddce0d   63MiB path/to/some-video-1080p.mp4
```
Rapide De Suppression De Fichiers

Supposons que vous souhaitez supprimer les fichiers a et b de chaque livraison accessible à partir de HEAD, vous pouvez utiliser cette commande:
```
git filter-branch --index-filter 'git rm --cached --ignore-unmatch a b' HEAD
```
- Si votre repo a des balises, vous souhaiterez probablement aussi ajouter le drapeau --tag-name-filter cat de marquer de nouveau le nouveau correspondant, s'engage comme ils sont réécrits, c'est à dire, git filter-branch --index-filter 'git rm --cached --ignore-unmatch a b' --tag-name-filter cat HEAD (voir cette réponse)
- Instructions Mac et quelques autres informations apparaissent dans l'original message lié
- git filter-branch --index-filter 'git rm --cached --ignore-unmatch <filename>' HEAD l'ordre du travail droit de la chauve-souris
- mon préféré répondre. un léger réglage pour une utilisation sur mac os (à l'aide de gnu commandes) git rev-list --objects --all \ | git cat-file --batch-check='%(objecttype) %(objectname) %(objectsize) %(rest)' \ | awk '/^blob/ {print substr($0,6)}' \ | sort --numeric-sort --key=2 \ | gnumfmt --field=2 --to=iec-i --suffix=B --padding=7 --round=nearest
InformationsquelleAutor Sridhar-Sarnobat
33

Ces commandes travaillé dans mon cas:
```
git filter-branch --force --index-filter 'git rm --cached -r --ignore-unmatch oops.iso' --prune-empty --tag-name-filter cat -- --all
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now
```
C'est un peu différent de versions ci-dessus.

Pour ceux qui en ont besoin pour pousser à l'github/bitbucket (j'ai uniquement testé avec bitbucket):
```
# WARNING!!!
# this will rewrite completely your bitbucket refs
# will delete all branches that you didn't have in your local

git push --all --prune --force

# Once you pushed, all your teammates need to clone repository again
# git pull will not work
```
- Comment est-il différent de ci-dessus, pourquoi est-il mieux?
- Pour une raison quelconque mkljun version n'est pas réduite git de l'espace dans mon cas, j'avais déjà supprimé les fichiers à partir de l'index en utilisant git rm --cached files. Le Greg de Bacon proposition est plus complet, et tout à fait la même chose à cette mine, mais il a raté l' --l'indice de force pour les cas où vous utilisez filter-branch plusieurs fois, et il a écrit tellement d'infos, que ma version est comme le résumé d'elle.
- Cela m'a vraiment aidé, mais j'avais besoin d'utiliser la -f option pas seulement -rf ici git rm --cached -rf --ignore-unmatch oops.iso au lieu de git rm --cached -r --ignore-unmatch oops.iso comme par @lfender6445 ci-dessous
InformationsquelleAutor Kostanos
29

Après avoir essayé pratiquement toutes les réponses dans l'affirmative, j'ai enfin trouvé ce petit bijou qui permet d'éliminer rapidement et supprimé les fichiers de grande taille dans mon référentiel et m'a permis de synchroniser à nouveau: http://www.zyxware.com/articles/4027/how-to-delete-files-permanently-from-your-local-and-remote-git-repositories

CD à votre dossier de travail et exécutez la commande suivante:
```
git filter-branch -f --index-filter "git rm -rf --cached --ignore-unmatch FOLDERNAME" -- --all
```
remplacer le nom du DOSSIER avec le fichier ou le dossier que vous souhaitez supprimer à partir de la donnée du répertoire git.

Une fois cela fait, lancez les commandes suivantes pour nettoyer le dépôt local:
```
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now
```
Maintenant pousser toutes les modifications sur le dépôt distant:
```
git push --all --force
```
Ce sera de nettoyer le dépôt distant.
- A travaillé comme un charme pour moi.
- Cela a fonctionné pour moi aussi. Se débarrasser d'un dossier spécifique (dans mon cas, celui qui contenait des fichiers trop volumineux ou un dépôt Github) sur le référentiel, mais la maintient sur le système de fichiers local dans le cas où il existe.
- A fonctionné pour moi! pas d'histoire est la gauche qui est potentiellement source de confusion (si quelqu'un où clone pour le moment), assurez-vous que vous avez un plan pour mettre à jour les liens rompus, dépendances, etc
InformationsquelleAutor Justin
9

Il suffit de noter que ces commandes peuvent être très destructrices. Si plusieurs personnes travaillent sur le repo ils vont tous avoir à tirer de la nouvelle arborescence. Les trois du milieu commandes ne sont pas nécessaires si votre but n'est PAS de réduire la taille. Parce que le filtre de la branche crée une copie de sauvegarde du fichier supprimé et il peut y rester pendant une longue période.
```
$ git filter-branch --index-filter "git rm -rf --cached --ignore-unmatch YOURFILENAME" HEAD
$ rm -rf .git/refs/original/
$ git reflog expire --all 
$ git gc --aggressive --prune
$ git push origin master --force
```
- Ne PAS exécuter ces commandes, sauf si vous voulez créer une immense douleur de vous-même. Il supprimé un grand nombre de mes fichiers de code source. Je suppose qu'il serait purge des fichiers volumineux à partir de mon commit l'histoire dans GIT (comme pour la question d'origine), cependant, je pense que cette commande est conçu de façon permanente la purge des fichiers à partir de votre code source d'origine de l'arbre (grande différence!). Mon système: Windows, VS2012, Source de Git Fournisseur de Contrôle.
- J'ai utilisé cette commande: git filter-branch --force --index-filter 'git rm --cached -r --ignore-unmatch oops.iso' --prune-empty --tag-name-filter cat -- --all au lieu de la première un à partir de votre code
InformationsquelleAutor mkljun
9

git filter-branch --tree-filter 'rm -f path/to/file' HEAD
a fonctionné assez bien pour moi, même si je suis dans la même situation que décrit ici, que j'ai résolu en suivant cette suggestion.

La pro-git livre a un chapitre entier sur les réécriture de l'histoire - avoir un regard sur le filter-branch/la Suppression d'un Fichier à partir de Chaque livraison section.

InformationsquelleAutor Thorsten Lorenz
8

Si vous savez que votre livraison récente au lieu de passer par l'ensemble de l'arborescence effectuer les opérations suivantes:
git filter-branch --tree-filter 'rm LARGE_FILE.zip' HEAD~10..HEAD

InformationsquelleAutor Soheil
5

J'ai couru ce avec un compte bitbucket, où j'avais accidentellement stockées ginormous *.jpa sauvegardes de mon site.

git filter-branch --prune-empty --index-filter 'git rm -rf --cached --ignore-unmatch MY-BIG-DIRECTORY-OR-FILE' --tag-name-filter cat -- --all

Relpace MY-BIG-DIRECTORY avec le dossier en question de réécrire complètement votre histoire (y compris les balises).

source: http://naleid.com/blog/2012/01/17/finding-and-purging-big-files-from-git-history
- Cette réponse m'a aidé, sauf le script dans la réponse a un léger problème et il ne faut pas chercher dans toutes les branches forment moi. Mais la commande dans le lien il l'a fait parfaitement.
InformationsquelleAutor lfender6445
3

Vous pouvez faire cela en utilisant la branch filter commande:

git filter-branch --tree-filter 'rm -rf path/to/your/file' HEAD

InformationsquelleAutor John Foley

En gros, j'ai fait ce qui était sur cette réponse:
https://stackoverflow.com/a/11032521/1286423

(pour l'histoire, je vais le copier-coller ici)

$ git filter-branch --index-filter "git rm -rf --cached --ignore-unmatch YOURFILENAME" HEAD
$ rm -rf .git/refs/original/
$ git reflog expire --all 
$ git gc --aggressive --prune
$ git push origin master --force

Il n'a pas de travail, parce que je tiens à renommer et déplacer des choses beaucoup. De sorte que certains gros dossiers dans des dossiers qui ont été renommés, et je pense que le gc ne pouvais pas supprimer la référence à ces fichiers car de référence dans tree objets pointant vers ces fichiers.
Mon ultime solution pour vraiment tuer c'était:

# First, apply what's in the answer linked in the front
# and before doing the gc --prune --aggressive, do:

# Go back at the origin of the repository
git checkout -b newinit <sha1 of first commit>
# Create a parallel initial commit
git commit --amend
# go back on the master branch that has big file
# still referenced in history, even though 
# we thought we removed them.
git checkout master
# rebase on the newinit created earlier. By reapply patches,
# it will really forget about the references to hidden big files.
git rebase newinit

# Do the previous part (checkout + rebase) for each branch
# still connected to the original initial commit, 
# so we remove all the references.

# Remove the .git/logs folder, also containing references
# to commits that could make git gc not remove them.
rm -rf .git/logs/

# Then you can do a garbage collection,
# and the hidden files really will get gc'ed
git gc --prune --aggressive

Mon repo (le .git) a changé de 32 MO à 388KB, que même filter-branch ne pouvais pas la nettoyer.

InformationsquelleAutor Dolanor

1

Utilisation Git Extensions, c'est une INTERFACE utilisateur de l'outil. Il a un plugin nommé "Trouver les gros fichiers" qui se retrouve lage des fichiers dans des référentiels et permettre de retirer leur permenently.

Ne pas utiliser git filter-branch' avant d'utiliser cet outil, car il ne sera pas en mesure de trouver les fichiers supprimés par "filter-branch' (Barbante 'filter-branch' ne supprime pas les fichiers complètement à partir du référentiel de fichiers de pack).
- Cette méthode est waaay trop lent pour les grands dépôts. Il a fallu plus d'une heure pour lister les fichiers de grande taille. Puis quand je vais pour supprimer des fichiers, après une heure, il est seulement 1/3 de la manière grâce à la transformation du premier fichier que je veux supprimer.
- Oui, c'est lent, mais fait le travail... savez-vous quelque chose de plus rapide?
- Ne l'ai pas utilisé, mais BFG opérations de nettoyage, que par une autre réponse sur cette page.
InformationsquelleAutor Nir
1

Quand vous avez ce problème, git rm ne suffira pas, comme git se souvient que le fichier existait autrefois dans notre histoire, et donc de conserver une référence à elle.

Pour aggraver les choses, la relocalisation n'est pas facile, parce que de toute référence à la goutte permettra d'éviter git garbage collector de nettoyage de l'espace. Cela comprend les références à distance et reflog références.

J'ai mis en place git forget-blob, un petit script qui tente de retirer toutes ces références, puis utilise git filter-branch à réécrire chaque commit de la branche.

Une fois votre blob est complètement non référencées, git gc va se débarrasser de cela

L'utilisation est assez simple git forget-blob file-to-forget. Vous pouvez obtenir plus d'info ici

https://ownyourbits.com/2017/01/18/completely-remove-a-file-from-a-git-repository-with-git-forget-blob/

J'ai mis cela ensemble grâce aux réponses de Débordement de Pile et certains entrées de blog. Des crédits afin de!
- vous devriez obtenir ceci dans homebrew
InformationsquelleAutor nachoparker

git filter-branch est une commande puissante que vous pouvez utiliser pour supprimer un fichier énorme de la commet l'histoire. Le fichier va rester pendant un certain temps et Git supprime dans la prochaine collecte de déchets.
Ci-dessous est le processus complet de deleteing des fichiers à partir de commettre l'histoire. Pour plus de sécurité, il est d'abord exécuter la commande sur une nouvelle branche:

# Do it in a new testing branch
$ git checkout -b test

# Remove file-name from every commit on the new branch
# --index-filter, rewrite index without checking out
# --cached, remove it from index but not include working tree
# --ignore-unmatch, ignore if files to be removed are absent in a commit
# HEAD, execute the specified command for each commit reached from HEAD by parent link

$ git filter-branch --index-filter 'git rm --cached --ignore-unmatch file-name' HEAD

# The output is OK, reset it to the prior branch master
$ git checkout master
$ git reset --soft test

# Remove test branch
$ git branch -rm test

# Push it with force
$ git push --force origin master

InformationsquelleAutor zhangyu12

Vous devez vous connecter pour publier un commentaire.

À l'aide de git filter-branch

Rebase interactif

Extrêmement rapides shell one-liner

La Base De Script

Rapide De Suppression De Fichiers

À l'aide de `git filter-branch`