Git深入浅出 - Git对象模型

142 阅读5分钟

对象名:

所有用来表示项目历史信息的文件,是通过一个40个字符的(40-digit)“对象名”来索引的,对象名看起来像这样:

6ff87c4664981e4397625791c8ea3bbb5f2279a3

每一个“对象名”都是通过对“对象内容“做哈希(SHA1)计算得来的,这样做有如下好处:

  • Git只需要比较对象名,就可以判断两个对象内容是否相同;
  • 两个不同仓库中的相同内容文件,其对象名相同(因为每个仓库对象名的计算方法都完全一样) 每一个对象包括三个部分:类型大小内容。大小就是指内容的大小,内容取决于对象的类型,有四种类型的对象:"blob"、"tree"、 "commit" 和"tag"。
  • “blob” 用来存储文件数据,通常是一个文件。
  • “tree” 有点像一个目录,它管理一些 “tree” 或是  “blob” (就像文件和子目录)
  • 一个 “commit” 只指向一个"tree",它用来标记项目某一个特定时间点的状态。它包括一些关于时间点的元数据,如时间戳、最近一次提交的作者、指向上次提交(commits)的指针等等。
  • 一个 “tag” 是来标记某一个提交(commit) 的方法。

Blob对象

简介:一个"blob对象"就是一块二进制数据,用来存储文件的内容(因为blob对象内容全部都是数据,如两个文件在一个目录树(或是一个版本仓库)中有同样的数据内容,那么它们将会共享同一个blob对象)。它没有指向任何东西或有任何其它属性,甚至连文件名都没有,因此Blob对象和其所对应的文件所在路径、文件名是否改被更改都完全没有关系。

相关git命令

  • git show Blob对象的SHA1值

Tree 对象

简介:一个tree对象有一串(bunch)指向blob对象或是其它tree对象的指针,它一般用来表示内容之间的目录层次关系。

mode对象类型SHA1值名字
100644blob63c918c667fa005ff12ad89437f2fdc80926e21c.gitignore
100755tree63c918c667fa005ff12ad89437f2fdc80926e21cdocument

就如同你所见,一个tree对象包括一串(list)条目,每一个条目包括:mode、对象类型、SHA1值 和名字(这串条目是按名字排序的)。它用来表示一个目录树的内容。

一个tree对象可以指向(reference): 一个包含文件内容的blob对象, 也可以是其它包含某个子目录内容的其它tree对象. Tree对象、blob对象和其它所有的对象一样,都用其内容的SHA1哈希值来命名的;只有当两个tree对象的内容完全相同(包括其所指向所有子对象)时,它的名字才会一样,反之亦然。这样就能让Git仅仅通过比较两个相关的tree对象的名字是否相同,来快速的判断其内容是否不同。

注意:所有的文件的mode位都是644 或 755,这意味着Git只关心文件的可执行位. 相关git命令

  • git show tree对象的SHA1值
  • git ls-tree tree对象的SHA1值(可以查看更多细节内容)

Commit对象

简介:"commit对象"指向一个"tree对象", 并且带有相关的描述信息.

image.png 你可以看到, 一个提交(commit)由以下的部分组成:

  • 一个 tree 对象: tree对象的SHA1签名, 代表着目录在某一时间点的内容.

  • 父对象 (parent(s)): 提交(commit)的SHA1签名代表着当前提交前一步的项目历史. 上面的那个例子就只有一个父对象; 合并的提交(merge commits)可能会有不只一个父对象. 如果一个提交没有父对象, 那么我们就叫它“根提交"(root commit), 它就代表着项目最初的一个版本(revision). 每个项目必须有至少有一个“根提交"(root commit). 一个项目可能有多个"根提交“,虽然这并不常见(这不是好的作法).

  • 作者 : 做了此次修改的人的名字, 还有修改日期.

  • 提交者(committer): 实际创建提交(commit)的人的名字, 同时也带有提交日期. TA可能会和作者不是同一个人; 例如作者写一个补丁(patch)并把它用邮件发给提交者, 由他来创建提交(commit).

  • 注释 用来描述此次提交. 注意: 一个提交(commit)本身并没有包括任何信息来说明其做了哪些修改; 所有的修改(changes)都是通过与父提交(parents)的内容比较而得出的. 值得一提的是, 尽管git可以检测到文件内容不变而路径改变的情况, 但是它不会去显式(explicitly)的记录文件的更名操作.

一般用 git commit来创建一个提交(commit), 这个提交(commit)的父对象一般是当前分支(current HEAD), 同时把存储在当前索引(index)的内容全部提交. 相关git命令

  • git show -s --pretty=raw 对象的SHA1值(查看某个commit提交)

对象模型

现在我们已经了解了3种主要对象类型(blob, tree 和 commit), 现在就让我们大概了解一下它们怎么组合到一起的.

如果我们一个小项目, 有如下的目录结构:

image.png

如果我们把它提交(commit)到一个Git仓库中, 在Git中它们也许看起来就如下图:

image.png

你可以看到: 每个目录都创建了 tree对象 (包括根目录), 每个文件都创建了一个对应的 blob对象 . 最后有一个 commit对象 来指向根tree对象(root of trees), 这样我们就可以追踪项目每一项提交内容.

标签对象

简介:一个标签对象包括一个对象名(SHA1签名), 对象类型, 标签名, 标签创建人的名字("tagger"), 还有一条可能包含有签名(signature)的消息.

image.png 相关git命令

  • git cat-file