git奇技淫巧

2,658 阅读5分钟

最近部门老大为了核算各位员工的绩效考核,想出了一个特别实在的办法 - 就是统计每个开发人员的工作量。那么问题来了,工作量这个玩意是很虚的,具体用什么来衡量呢?具体分一下三个部分:

  • 具体工作内容
  • 代码行数
  • 完成工作的时间

其实都好说,除了这个代码行数,怎么来统计这个呢?

有说用 Eclipse 来统计的,也有说用其他编辑器来统计的,大家八仙过海各显神通。以下是我的解决方案。

问题入手

所有经手的项目源代码就是上传到远程的 git 仓库的,有 gitlabgithub 等等。

从项目的初始化到项目的每一次代码提交,在每个项目的 .git 目录下都有详细的记录。

这样说来,问题就好解决了,找 git !

解决问题

在网上搜索 git 代码统计的相关命令集 https://segmentfault.com/a/1190000002434755 发现里面确有文章。

主要有以下几个命令集

统计某个项目参与人的代码提交量,包括增加、删除以及最后的差值

git log --author="$(git config --get user.name)" --pretty=tformat: --numstat | gawk '{ add += $1 ; subs += $2 ; loc += $1 - $2 } END { printf "added lines: %s removed lines : %s total lines: %s\n",add,subs,loc }' -

其中的 "$(git config --get user.name)" 可以替换成自己参与项目的用户名

注意:当命令运行在除 Linux 的机器上时,可能会报 gawk 不存在的错误,此时不要慌张。

报错解决方案:

  • 1、安装 Homebrew (安装过 Homebrew 的用户请自动跳过)

    可以参照官网

  • 2、安装 GNU 命令行工具

    brew install coreutils

    • 接下来,就可以安装自己想要的软件了(若有些包安装失败,请尝试先执行 brew tap homebrew/dupes
        brew install binutils
        brew install diffutils
        brew install ed --default-names
        brew install findutils --with-default-names
        brew install gawk
        brew install gnu-indent --with-default-names
        brew install gnu-sed --with-default-names
        brew install gnu-tar --with-default-names
        brew install gnu-which --with-default-names
        brew install gnutls
        brew install grep --with-default-names
        brew install gzip
        brew install screen
        brew install watch
        brew install wdiff --with-gettext
        brew install wget
    

    这里我们缺少 gawk 包,所以在命令行执行 brew install gawk 即可。

    -- default-names 选项会阻止 Homebrew 预加 gs 到新安装的命令,这样我们就可以默认使用这些命令,从而覆盖 OS X预装的命令。

命令安装成功后,再次执行上面的命令就不会报错了!

我这里在其中一个项目中执行的结果是 added lines: 11626 removed lines : 2722 total lines: 8904

git 周边

仓库提交者通过用户名排名(目前是查看前5,数字可以自由设置,若想查看全部排行,去掉 head 管道即可)

git log --pretty='%aN' | sort | uniq -c | sort -k1 -n -r | head -n 5

仓库提交者通过邮箱排名(这里根据实际情况操作,可能一个人拥有多个邮箱,目前是查看前5,数字可以自由设置,若想查看全部排行,去掉 head 管道即可)

git log --pretty=format:%ae | gawk -- '{ ++c[$0]; } END { for(cc in c) printf "%5d %s\n",c[cc],cc; }' | sort -u -n -r | head -n 5

贡献者统计

git log --pretty='%aN' | sort -u | wc -l

提交数统计

git log --oneline | wc -l

git log 参数说明:

--author        指定作者
--stat          显示每次更新的文件修改统计信息,会列出具体文件列表
--shortstat     统计每个commit 的文件修改行数,包括增加,删除,但不列出文件列表  
--numstat       统计每个commit 的文件修改行数,包括增加,删除,并列出文件列表
-p              选项展开显示每次提交的内容差异,用 -2 则仅显示最近的两次更新 (git log -p  -2)
--name-only     仅在提交信息后显示已修改的文件清单
--name-status   显示新增、修改、删除的文件清单
--abbrev-commit 仅显示 SHA-1 的前几个字符,而非所有的 40 个字符
--relative-date 使用较短的相对时间显示(比如,“2 weeks ago”)
--graph         显示 ASCII 图形表示的分支合并历史
--pretty        使用其他格式显示历史提交信息。可用的选项包括 oneline,short,full,fuller 和 format(后跟指定格式)
--pretty=tformat:   可以定制要显示的记录格式,这样的输出便于后期编程提取分析 (例如:git log --pretty=format:""%h - %an, %ar : %s"")
        选项        说明                  
        %H          提交对象(commit)的完整哈希字串               
        %h          提交对象的简短哈希字串               
        %T          树对象(tree)的完整哈希字串                   
        %t          树对象的简短哈希字串                    
        %P          父对象(parent)的完整哈希字串               
        %p          父对象的简短哈希字串                   
        %an         作者(author)的名字              
        %ae         作者的电子邮件地址                
        %ad         作者修订日期(可以用 -date= 选项定制格式)                   
        %ar         作者修订日期,按多久以前的方式显示                    
        %cn         提交者(committer)的名字                
        %ce         提交者的电子邮件地址                    
        %cd         提交日期                
        %cr         提交日期,按多久以前的方式显示              
        %s          提交说明  
--since         限制显示输出的范围 (例如: git log --since=2.weeks    显示最近两周的提交)
        选项                说明                
       -(n)                 仅显示最近的 n 条提交                    
       --since, --after     仅显示指定时间之后的提交。                    
       --until, --before    仅显示指定时间之前的提交。                  
       --author             仅显示指定作者相关的提交。                
       --committer          仅显示指定提交者相关的提交。
一些列子

git log --until=1.minute.ago 一分钟之前的所有 log

git log --since=1.day.ago 一天之内的log

git log --since=1.hour.ago 一个小时之内的 log

git log --since=1.month.ago --until=2.weeks.ago 一个月之前到半个月之前的log

git log --since ==2017-12-01 --until=2017-12-31 某个时间段的 log

git blame 【file】看看某一个文件的相关历史记录

注意:以上关于 git 的命令集必须在 git 管理的项目目录下运行才有效