Git如何删除历史记录中的大文件详解

 更新时间:2018年07月01日 14:46:00   作者:laocaixw  
这篇文章主要给大家介绍了关于Git如何删除历史记录中大文件的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

前言

Git 作为一个分布式的版本管理工具,代码仓库中是会保存所有历史记录的。虽然,Git 的 .gitignore 文件里可以定义一些忽略文件的规则,但是,在我们提交代码的过程中,总会不小心误提一些没用的文件,如果文件中存在大文件,就会导致:就算我们把它删了重新提交,.git 文件夹依然会占用较大的空间。

如何解决这个问题呢?其实,Git 已经为我们提供了解决方案,就是被称为核弹级的命令 filter-branch。这个命令可以用来修改历史提交记录,把不需要的文件永久地从历史记录中删除。

方法如下:

首先,我们需要找出大文件。

找出排名前 5 的 pack 记录:

git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -5

可以看到这样的信息:

1753e0b6aa1cd3ed27d1d14e8e569664c685e896 blob 44600 43841 37970
ca12c545eae19d688ac840c7f0e2e623a1a4192b blob 45262 8534 140448
7a3265ee94c0ab25cf079ac8ccdf87f41d455d42 blob 54708 49093 171307
72590cee1315e32dada25535184dcee97c6f5af9 blob 1114323 1104823 113887612
4cc1f9dcef1004355d2a595d45808e99f100dc4d blob 114592569 113703558 184054

最后一条就是最大的一条记录,4cc1f9dcef1004355d2a595d45808e99f100dc4d 是它的 id。
找出该记录对应的文件:

git rev-list --objects --all | grep 4cc1f9dcef1004355d2a595d45808e99f100dc4d

可以看到:

4cc1f9dcef1004355d2a595d45808e99f100dc4d app/src/main/assets/Android群英传.pdf

这个文件就是罪魁祸首,它占了有 100 多 M 的空间。

将该文件从历史记录中移除:

git log --pretty=oneline --branches -- app/src/main/assets/Android群英传.pdf

重写所有 commit,将该文件从 Git 历史中完全移除:

git filter-branch --index-filter 'git rm --cached --ignore-unmatch app/src/main/assets/Android群英传.pdf' -- --all

到这里,历史记录中已经没有该文件了。不过运行 filter-branch 产生的日志还是会对该文件有引用,所以还需要运行以下几条命令,把该文件的引用完全删除:

rm -Rf .git/refs/original
rm -Rf .git/logs/
git gc
git prune

这个时候,再看文件夹,已经小了很多了。然后就可以 push 代码了,不过就是需要强制 push:

git push --force

以上就是删除 Git 历史记录中大文件的过程。

当然 filter-branch 的作用还不止这些,比如它还可以用来修改历史提交记录中的用户名(username)和邮箱(email)等。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

相关文章

  • npm script 的文件监听和自动刷新的命令详解

    npm script 的文件监听和自动刷新的命令详解

    文件监听的作用是为了实现自动化,释放双手和精力,提高效率,让开发者更加关注于开发。这篇文章主要介绍了npm script 的文件监听和自动刷新,需要的朋友可以参考下
    2019-06-06
  • 算法系列15天速成 第九天 队列

    算法系列15天速成 第九天 队列

    可能大家都知道,线性表的变种非常非常多,比如今天讲的“队列”,灰常有意思啊
    2013-11-11
  • kali添加开机自启的方法

    kali添加开机自启的方法

    采用systemd的方法,kali默认是没有rc.local的,需要自己创建。本方法也适用于ubuntu 18.04 64bit,对kali添加开机自启知识感兴趣的朋友一起看看吧
    2022-09-09
  • VSCode提高 Node 和 Vue 开发效率的插件推荐

    VSCode提高 Node 和 Vue 开发效率的插件推荐

    工欲善其事必先利其器,以下是本人为Node 和 Vue开发收集的vscode插件,有需要的话赶紧mark起来吧~
    2020-03-03
  • 如何解决vscode中ESLint和prettier冲突问题

    如何解决vscode中ESLint和prettier冲突问题

    这篇文章主要给大家介绍了关于如何解决vscode中ESLint和prettier冲突问题的相关资料,ESLint和Prettier之间可能会发生冲突,因为它们都是用于代码规范化的工具,但它们的规则和格式化方式可能不同,需要的朋友可以参考下
    2023-11-11
  • scratch-www 在Win10下的环境搭建详细教程

    scratch-www 在Win10下的环境搭建详细教程

    scratch-www是scratch-gui的网页版,功能包括gui的编辑,保存,播放,和gui的作品展示,这里主要介绍scratch-www在window系统下的安装和运行,感兴趣的朋友跟随小编一起看看吧
    2021-08-08
  • vscode远端配置及一些问题解决方案

    vscode远端配置及一些问题解决方案

    我们之前大概了解了vscode的本地设置,我们之前提过,vscode是一款编辑器,在文本编辑方面有着强大的功能,vscode强大的功能还在于可以连接远端机器,为我们的远端机器服务,今天我们主要来进行远端配置,感兴趣的朋友跟随小编一起看看吧
    2024-03-03
  • IDEA Git Stash 使用详解

    IDEA Git Stash 使用详解

    这篇文章主要介绍了IDEA Git Stash 使用详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • webp 格式图片显示异常分析及解决方案

    webp 格式图片显示异常分析及解决方案

    WebP,谷歌(google)开发的一种旨在加快图片加载速度的图片格式。提供了有损压缩与无损压缩(可逆压缩)的图片文件格式,能节省大量的服务器带宽资源和数据空间,这篇文章主要介绍了webp 格式图片显示异常分析及解决方案,需要的朋友可以参考下
    2023-04-04
  • VS2019无法启动程序(系统找不到指定文件)解决办法

    VS2019无法启动程序(系统找不到指定文件)解决办法

    这篇文章主要介绍了VS2019无法启动程序(系统找不到指定文件)解决办法,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08

最新评论