git 经验谈（一）：认识 git 的结构最近想写一篇 git 的向导，由于 git 的使用方式非常灵活，每个人对 gi

最近想写一篇 git 的向导，由于 git 的使用方式非常灵活，每个人对 git 也有不同的使用偏好，所以写一下自己的经验还是很值得的。另外，现在总结一下使用经验，今后开展项目可以做到有备无患。根据我的总结，git 还是有不少东西值得写的，所以想把我写的东西分成几块，有个前后顺序。这是第一篇，介绍一下基本的入门知识，再讲讲 git 的整体结构是什么样的。Let's go!

什么是 git

git 是一个用于软件开发的代码版本控制系统。它有以下特点：

分布式：git 不依赖于集中的版本控制服务器，不同的用户创建自己的库后，可以自由地在其基础上做版本管理
免费开源

git repositories 的空间视角

总的来说，git repository 是一个复杂的数据结构，开发者需要对整体有一个基本的了解。我建议把工作中使用的 git repository 看作一个三维的空间。下面就来说一下 git 空间的三个维度。

第一维度：commit history

commit 是一次代码提交，它实现版本管理最基础的功能 —— 把修改历史划分为不同的版本。它也是 git 在切换不同版本时的最小单位。我们平时写代码时，每一次写完一个完整的代码逻辑，就可以做一次代码提交。每一次提交都要确保达到以下要求：

项目可以编译成功
未实现的部分能显示合理的提示或者抛出 NotImplementedException 之类的异常

第二维度：branch

branch 是代码的副本，服务于团队开发中不同的开发者专注于各自的工作任务。除了默认的 master 分支，我们在创建分支时都会基于一个原有的分支进行拷贝，创建完成后，新分支也保留了原有分支的 commit hostory。

第三维度：remote

和你的本地库产生关联的远程库叫remote。我们经常使用 git clone 命令去拷贝别人的代码，这个命令生成的本地库就带有 remote 信息。可以使用 git remote -v 查看当前库的 remote 的详细信息。虽然 git 是分布式的，但是开展团队开发工作时通常还是把 repository 分为“团队的库”和“自己的库”，另外，团队还会使用 Github 这样的代码托管服务。通常的团队开发中，每个开发者（对于同一个项目）会用到三个库，两个远程的，一个本地的。下面说明一下这三个库：

简称	remote主机名	host在哪里	用途
自己的本地库	-	开发者本地	进行本地开发和调试，解决代码合并时的冲突
自己的远程库	origin	github之类的代码托管服务	代码远程存储，更便捷地使用托管服务的Pull Request等功能
团队的远程库	upstream	github之类的代码托管服务	管理产品源代码，管理开发迭代中的代码，代码权限管理

产品开发过程中，代码的流向应该是这样的：

remote之间的关系

解释一下上图中的步骤：

local -> origin：一般是准备提交到团队库之前就先提交到origin，或者是需要远程备份自己的代码时这么做。这里的虚线是从自己的远程备份下载代码时这么做。
origin -> upstream：提交 Rull Request 时这样操作。
upstream -> local：需要从团队库更新代码时这样做。我的习惯是直接 pull（信任团队的代码是可靠的），就不分步 fetch 和 merge 了。

这样就形成了图中所示的逆时针工作流。

直接把团队库当成origin岂不更好？ 这样只是看上去简单，对团队整体而言是不好的。团队的库是要做权限管理的，不宜把团队库的某个分支当作“自己的远程库”。 {: .notice--info}

基于以上的空间划分，git 的空间视角应该是这样的：

git空间视角

图中的每个圆点代表一个 commit，每个横向的直线+箭头代表一个分支，每一个平面代表一个 repository 副本。（图中的虚线没有实际意义，只是为了看上去像是立体的）

使用 checkout 命令在 git 空间中“穿梭”

checkout 命令有很多用法，最主要的有两个：在不同的分支间切换；在不同的 commit 状态间切换。前者是基本操作，后者显得高级一点。这里主要说一下后者，因为在 commit 间切换使 git 用法更加灵活，但容易遇到问题。开发者每次提交之后，生成的 commit 都有一个对应的 SHA-1 哈希值（通过 git log 或图形化工具也能拿到这个值），通过使用 git checkout 后面加上这个哈希值就能实现在 commit 之间切换，像下面这样：

git checkout dc3966be219e95abe2b098858e1ef4dd79f4b84d

这样使用 checkout 命令会让 git 处于 detached HEAD 状态，字面意思看，是“脑袋错位了”。开发者要注意，如果你处于 detached HEAD 状态，一定是为了查看某个 commit 后状态的代码（或在此基础上做调试），查看完之后一定要通过“某种方式”还原到正常状态，否则可能会出问题。说到这里，有几个事情必须解释一下：

**什么是 HEAD？**HEAD是一个指针，它指向目前你本地文件所处的状态。我们可以把 commit history 看作一个链表，每个 commit 是链表上的一个节点，开发者本地文件的状态必然是处于某一个节点上，HEAD 正是指向这个节点。正常状态下 HEAD 总是处于这个链表的最后一个节点。
**什么是 detached HEAD？**当我们执行 checkout 命令且把哈希值作为参数切换到某个 commit 之后的状态时， HEAD就不再指向“正常”的位置了，这种状态就是 detached HEAD。
**上文中提到的“某种方式”是什么？**为了回到正常状态，你有两种选择：1. 使用 git checkout [branchName] 回到某个分支；2. 在当前的 commit 状态下建一个新的分支，使用 git checkout -b [newBranchName]。
**不从 detached HEAD 状态切换回正常状态会导致什么问题？**处于 detached HEAD 状态下也可以提交新的 commit，如果开发者在这种状态下提交新的 commit，commit history 这个链表就分叉了！如果开发者对眼前的状态不是很清楚，可能会把自己要提交的内容弄丢。

这篇就先写到这儿，主要是想说一下“如何看 git”。一些代码提交、修改的知识比较零碎，准备放在今后的文章里写，目前来看，还有以下几篇是今后要写的：

图形化辅助工具
代码的提交/合并
团队使用规范

最后再推荐一篇攻略，我觉得这篇借助图形讲得非常好：A Visual Git Reference

感谢您的阅读，欢迎提出您的看法。

此文的原文链接：git 经验谈（一）：认识 git 的结构