Git重置揭密

102 阅读12分钟

重置揭密

  讨论一下reset与checkout。 在你初次遇到的 Git 命令中,这两个是最让人困惑的。它们能做很多事情,所以看起来我们很难真正地理解并恰当地运用它们。 针对这一点,我们先来做一个简单的比喻。

一、三棵树

  理解reset和checkout的最简方法,就是以Git 的思维框架(将其作为内容管理器)来管理三棵不同的树。"树"在我们这里的实际意思是 "文件的集合",而不是指特定的数据结构。 (在某些情况下索引看起来并不像一棵树,不过我们现在的目的是用简单的方式思考它。)

Git 作为一个系统,是以它的一般操作来管理并操纵这三棵树的:

用途
HEAD 上一次提交的快照,下一次提交的父结点
Index 预期的下一次提交的快照
Working Directory 沙盒

HEAD

  HEAD 是当前分支引用的指针,它总是指向该分支上的最后一次提交。这表示 HEAD将是下一次提交的父结点。通常,理解HEAD的最简方式,就是将它看做 你的上一次提交的快照。   其实,查看快照的样子很容易。下例就显示了HEAD 快照实际的目录列表,以及其中每个文件的SHA-1校验和:

  cat-file与ls-tree是底层命令,它们一般用于底层工作,在日常工作中并不使用。不过它们能帮助我们了解到底发生了什么。

索引

  索引是你的预期的下一次提交。我们也会将这个概念引用为Git 的"暂存区域",这就是当你运行git commit时Git看起来的样子。

  Git将上一次检出到工作目录中的所有文件填充到索引区,它们看起来就像最初被检出时的样子。之后你会将其中一些文件替换为新版本,接着通git commit将它们转换为树来用作新的提交。

$ git ls-tree -r HEAD
100644 blob 9ecc6e65105c28fefef3e397c836121aa9eac2c0    a.txt
100644 blob 0b669b66edab0c5c5ef2a11130752c24285b5202    b.txt

  ls-files这个命令,它会显示出索引当前的样子。

  确切来说,索引并非技术上的树结构,它其实是以扁平的清单实现的。不过对我们而言,把它当做树就够了。

工作目录

  最后,就有了自己的工作目录。 另外两棵树以一种高效但并不直观的方式,将它们的内容存储在.git文件夹中。 工作目录会将它们解包为实际的文件以便编辑。你可以把工作目录当做 沙盒。在你将修改提交到暂存区并记录到历史之前,可以随意更改。

二、工作流程

  Git主要的目的是通过操纵这三棵树来以更加连续的状态记录项目的快照。

  我们来可视化这个过程:假设我们进入到一个新目录,其中有一个文件。 我们称其为该文件的v1 版本,将它标记为蓝色。现在运行git init,这会创建一个Git 仓库,其中的HEAD引用指向未创建的分支(master 还不存在)。

  此时,只有工作目录有内容。

  现在我们想要提交这个文件,所以用"git add" 来获取工作目录中的内容,并将其复制到索引中。

  接着运行 git commit,它会取得索引中的内容并将它保存为一个永久的快照,然后创建一个指向该快照的提交对象,最后更新master来指向本次提交。

  此时如果我们运行 git status,会发现没有任何改动,因为现在三棵树完全相同。   现在我们想要对文件进行修改然后提交它。 我们将会经历同样的过程;首先在工作目录中修改文件。我们称其为该文件的v2 版本,并将它标记为红色。

  如果现在运行git status,我们会看到文件显示在"Changes not staged for commit"下面并被标记为红色,因为该条目在索引与工作目录之间存在不同。接着我们运行 git add来将它暂存到索引中。

  此时,由于索引和HEAD不同,若运行git status的话就会看到"Changes to be committed"下的该文件变为绿色 ——也就是说,现在预期的下一次提交与上一次提交不同。 最后,我们运行git commit来完成提交。

  现在运行 git status 会没有输出,因为三棵树又变得相同了 。   切换分支或克隆的过程也类似。 当检出一个分支时,它会修改HEAD 指向新的分支引用,将索引填充为该次提交的快照,然后将索引的内容复制到工作目录 中。

三、重置的作用

  在以下情景中观察reset命令会更有意义。

  为了演示这些例子,假设我们再次修改了file.txt文件并第三次提交它。 现在的历史看起来是这样的:

  让我们跟着reset看看它都做了什么。 它以一种简单可预见的方式直接操纵这三棵树。它做了三个基本操作。

第1步:移动HEAD

reset做的第一件事是移动HEAD的指向。这与改变HEAD自身不同(checkout 所做的);reset移动HEAD指向的分支。这意味着如果HEAD设置为master 分支(例如,你正在master分支上),运行git reset 9e5e6a4将会使master指向 9e5e6a4。

  无论你调用了何种形式的带有一个提交的reset,它首先都会尝试这样做。 使用reset --soft,它将仅仅停在那儿。

  现在看一眼上图,理解一下发生的事情:它本质上是撤销了上一次git commit 命令。当你在运行git commit时,Git会创建一个新的提交,并移动HEAD 所指向的分支来使其指向该提交。 当你将它reset回 HEAD~(HEAD 的父结点)时,其实就是把该分支移动回原来的位置,而不会改变索引和工作目录。 现在你可以更新索引并再次运行git commit来完成git commit --amend所要做的事情了。

第2步:更新索引(--mixed)

  注意,如果你现在运行git status的话,就会看到新的HEAD 和以绿色标出的它和索引之间的区别。

  接下来,reset会用HEAD指向的当前快照的内容来更新索引。

  如果指定--mixed 选项,reset将会在这时停止。 这也是默认行为,所以如果没有指定任何选项(在本例中只是git reset HEAD~),这就是命令将会停止的地方。

  现在再看一眼上图,理解一下发生的事情:它依然会撤销一上次 提交,但还会取消暂存所有的东西。于是,我们回滚到了所有git add和git commit 的命令执行之前。

第3步:更新工作目录(--hard)

  reset要做的的第三件事情就是让工作目录看起来像索引。如果使用--hard 选项,它将会继续这一步。

  现在让我们回想一下刚才发生的事情。你撤销了最后的提交、git add和git commit命令以及工作目录中的所有工作。

  必须注意,--hard标记是reset命令唯一的危险用法,它也是Git 会真正地销毁数据的仅有的几个操作之一。其他任何形式的reset 调用都可以轻松撤消,但是--hard 选项不能,因为它强制覆盖了工作目录中的文件。 在这种特殊情况下,我们的Git数据库中的一个提交内还留有该文件的v3 版本,我们可以通过reflog来找回它。但是若该文件还未提交,Git 仍会覆盖它从而导致无法恢复。

回顾

  • reset命令会以特定的顺序重写这三棵树,在你指定以下选项时停止:

  • 移动HEAD分支的指向(若指定了--soft,则到此停止)

  • 使索引看起来像HEAD(若未指定--hard,则到此停止)

  • 使工作目录看起来像索引

通过路径来重置

  前面讲述了reset基本形式的行为,不过你还可以给它提供一个作用路径。 若指定了一个路径,reset将会跳过第1 步,并且将它的作用范围限定为指定的文件或文件集合。这样做自然有它的道理,因为 HEAD只是一个指针,你无法让它同时指向两个提交中各自的一部分。不过索引和工作目录 可以部分更新,所以重置会继续进行第2、3步。

现在,假如我们运行git reset file.txt(这其实是 git reset --mixed HEAD file.txt 的简写形式,因为你既没有指定一个提交的SHA-1或分支,也没有指定--soft或 --hard),它会:

  1. 移动 HEAD 分支的指向 (已跳过)

  2. 让索引看起来像 HEAD (到此处停止)

  所以它本质上只是将 file.txt 从 HEAD 复制到索引中。

  它还有取消暂存文件的实际效果。如果我们查看该命令的示意图,然后再想想 git add 所做的事,就会发现它们正好相反。

  这就是为什么git status 命令的输出会建议运行此命令来取消暂存一个文件。(查看取消暂存的文件 来了解更多。)

  我们可以不让Git从HEAD 拉取数据,而是通过具体指定一个提交来拉取该文件的对应版本。我们只需运行类似于git reset eb43bf file.txt的命令即可。

  它其实做了同样的事情,也就是把工作目录中的文件恢复到v1版本,运行git add 添加它,然后再将它恢复到v3版本(只是不用真的过一遍这些步骤)。如果我们现在运行 git commit,它就会记录一条"将该文件恢复到v1 版本"的更改,尽管我们并未在工作目录中真正地再次拥有它。

  还有一点同git add一样,就是reset命令也可以接受一个--patch 选项来一块一块地取消暂存的内容。这样你就可以根据选择来取消暂存或恢复内容了。

四、压缩

  我们来看看如何利用这种新的功能来做一些有趣的事情——压缩提交。

  假设你的一系列提交信息中有"oops.""WIP" 和"forgot this file", 聪明的你就能使用reset来轻松快速地将它们压缩成单个提交,也显出你的聪明。 (压缩提交 展示了另一种方式,不过在本例中用reset更简单。)

  假设你有一个项目,第一次提交中有一个文件,第二次提交增加了一个新的文件并修改了第一个文件,第三次提交再次修改了第一个文件。 由于第二次提交是一个未完成的工作,因此你想要压缩它。

  那么可以运行git reset --soft HEAD~2来将HEAD 分支移动到一个旧一点的提交上(即你想要保留的第一个提交):

  然后只需再次运行git commit:

  现在你可以查看可到达的历史,即将会推送的历史,现在看起来有个v1版 file-a.txt的提交,接着第二个提交将file-a.txt修改成了v3版并增加了file-b.txt。 包含v2版本的文件已经不在历史中了。

五、检出

  最后,你大概还想知道checkout和reset之间的区别。和reset 一样,checkout也操纵三棵树,不过它有一点不同,这取决于你是否传给该命令一个文件路径。

六、不带路径

  运行git checkout [branch]与运行 git reset --hard [branch] 非常相似,它会更新所有三棵树使其看起来像 [branch],不过有两点重要的区别。

  首先不同于reset --hard,checkout 对工作目录是安全的,它会通过检查来确保不会将已更改的文件弄丢。 其实它还更聪明一些。它会在工作目录中先试着简单合并一下,这样所有还未修改过的文件都会被更新。而reset --hard则会不做检查就全面地替换所有东西。

  第二个重要的区别是如何更新 HEAD。reset会移动HEAD分支的指向,而 checkout只会移动HEAD自身来指向另一个分支。

  例如,假设我们有master和develop分支,它们分别指向不同的提交;我们现在在develop 上(所以 HEAD 指向它)。 如果我们运行git reset master,那么develop自身现在会和 master指向同一个提交。而如果我们运行git checkout master 的话,develop 不会移动,HEAD 自身会移动。现在HEAD将会指向master。

  所以,虽然在这两种情况下我们都移动HEAD使其指向了提交 A,但做法是非常不同的。 reset 会移动HEAD分支的指向,而checkout则移动HEAD自身。

七、带路径

  运行checkout的另一种方式就是指定一个文件路径,这会像reset 一样不会移动HEAD。它就像git reset [branch] file 那样用该次提交中的那个文件来更新索引,但是它也会覆盖工作目录中对应的文件。 它就像是git reset --hard [branch] file(如果 reset 允许你这样运行的话)- 这样对工作目录并不安全,它也不会移动HEAD。

此外,同git reset和git add一样,checkout也接受一个--patch 选项,允许你根据选择一块一块地恢复文件内容。

总结

  希望你现在熟悉并理解了reset命令,不过关于它和checkout 之间的区别,你可能还是会有点困惑,毕竟不太可能记住不同调用的所有规则。

下面的速查表列出了命令对树的影响。"HEAD"一列中的"REF"表示该命令移动了HEAD 指向的分支引用,而"HEAD"则表示只移动了HEAD 自身。特别注意 WD Safe? 一列——如果它标记为NO,那么运行该命令之前请考虑一下。

HEAD Index Workdir WD Safe?
Commit Level
reset --soft [commit] REF NO NO YES
reset [commit] REF YES NO YES
reset --hard [commit] REF YES YES NO
checkout [commit] HEAD YES YES YES
File Level
reset (commit) [file] NO YES NO YES
checkout (commit) [file] NO YES YES NO