- 专栏地址:CI/CD 流水线
- 系列文章:CI/CD 半桶水(二)、CI/CD 半桶水(三)
- 本文作者:Clfeng
导学
CICD 是持续集成(Continuous Integration)、持续交付(Continuous Delivery)与持续部署(Continuous Deployment)的简称。指在开发过程中自动执行一系列脚本来减低开发引入 bug 的概率,在新代码从开发到部署的过程中,尽量减少人工的介入。相信大伙在工作中也经常与其接触,但可能由于岗位性质的原因,虽是天天使用但对其并不了解,当 CI/CD 流水线出了问题之后也只能是对外求助。为了摆脱这般困境,让我们通过一些列的文章来深入的了解下 CI/CD 吧。
本章的内容会一步步的带着我们从最初的项目创建到 CI/CD 环境安装再到一个简单流水线的编写让我们体会如何搭建自己的 CI/CD。最后会再讲解其最基础的概念,并让我们能清晰的了解我们写的第一个流水线的内容。
创建 GitLab 项目
环境安装
注:在企业基本都是使用 linux 环境作为 CI/CD 的 runner ,因此一下的环境安装使用的环境为 linux ;
操作系统信息:
Linux version 3.10.0-1160.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC) ) #1 SMP Mon Oct 19 16:18:59 UTC 2020
注:笔者的 linux 环境为在本地的 macOS 上通过虚拟机安装的 centos:7 系统
读者无需特意去买服务器,使用本地的主机通过虚拟机安装 linux 系统或者是将本地的 macOS 或者 window 作为 runner 都行,但不建议用 windows ,毕竟在写 CI 配置文件的时候会有很多的符号要注意
安装 docker
后续我们使用的 runner 会以 docker 作为执行器(executor),因此我们先在系统上安装一下 docker 吧。
docker 的安装可按照官网教程进行安装 docs.docker.com/engine/inst…
安装的基本流程:
1. 移除旧版本的 docker
sudo yum remove docker \
docker-client \
docker-client-latest \
docker-common \
docker-latest \
docker-latest-logrotate \
docker-logrotate \
docker-engine
2. 开始安装 docker
sudo yum install -y yum-utils
sudo yum-config-manager \
--add-repo \
https://download.docker.com/linux/centos/docker-ce.repo
# 安装docker引擎
sudo yum install docker-ce docker-ce-cli containerd.io
3. 启动 docker
sudo systemctl start docker
4. 安装成功
安装 runner
1. 执行一下脚本进行 gitlab-runner 的安装
# 1. 添加官方的GitLab仓库
curl -L "https://packages.gitlab.com/install/repositories/runner/gitlab-runner/script.rpm.sh" | sudo bash
# 2. 安装gitlab-runner
sudo yum install gitlab-runner
2. 安装成功
注册 runner
进入项目仓库 CI/CD 页面查看相应的 url 与 token
执行 gitlab-runner register
命令并根据提示注册 runner
注册成功之后,查看可用 runner
到此我们便准备好学习 CI/CD 的基本环境啦~
接着我们尝试写一个简单流水线
注:暂时不用去理解 .gitlab-ci.yml 的内容,后续会逐步讲解
第一个流水线
添加流水线配置文件
在项目根目录下,添加 .gitlab-ci.yml 文件,并推送到远程分支,文件内容如下:
# .gitlab-ci.yml
stages:
- build
- test
- deploy
build_job:
stage: build # 指定job所属stage
image: centos:7 # 指定执行job的所使用docker镜像
tags:
- clf-centos-runner # 指定执行job的runner(即机器)
script: # job执行时运行的脚本
- echo "build project"
test_job:
stage: test
image: centos:7
tags:
- clf-centos-runner
script:
- echo "test project"
deploy_job:
stage: deploy
image: centos:7
tags:
- clf-centos-runner
script:
- echo "deploy project"
查看流水线执行情况
理解基本概念
在《第一个流水线》章节,我们新增了 .gitlab-ci.yml 并且写了一堆的配置。然后提交文件推送到 GitLab 上之后便可看到有流水线在执行了。那么我们前面在 .gitlab-ci.yml 文件中写的的配置是什么意思?流水线的配置又该怎么写?
为了能写出一个基本的流水线配置,我们需要来学习一下下面的内容:
- yaml 语法
- 什么是 CI/CD
- CI/CD 的关键概念
- pipeline
- stage
- job
yaml 语法
CI/CD 流水线的配置文件使用的便是 yaml 语法写的,因此需要先理解一下相关的语法。这里推荐通过阮一峰老师的文章进行学习:
www.ruanyifeng.com/blog/2016/0…
什么是 CI/CD
CI/CD 可拆解为 CI 和 CD,其中 CI 为持续集成,CD 为持续交付与持续部署。CI/CD 是一种通过在应用开发阶段引入自动化来频繁向客户交付应用的方法。
- Continuous Integration (CI) 【持续集成】
- Continuous Delivery (CD) 【持续交付】
- Continuous Deployment (CD)【持续部署】
当然这么介绍可能还是简单了点,所以摘录了以下更为详细的介绍,感兴趣的可以稍微看看
持续集成
现代应用开发的目标是让多位开发人员同时处理同一应用的不同功能。但是,如果企业安排在一天内将所有分支源代码合并在一起(称为“合并日”),最终可能造成工作繁琐、耗时,而且需要手动完成。这是因为当一位独立工作的开发人员对应用进行更改时,有可能会与其他开发人员同时进行的更改发生冲突。如果每个开发人员都自定义自己的本地集成开发环境(IDE),而不是让团队就一个基于云的 IDE 达成一致,那么就会让问题更加雪上加霜。
持续集成(CI)可以帮助开发人员更加频繁地(有时甚至每天)将代码更改合并到共享分支或“主干”中。一旦开发人员对应用所做的更改被合并,系统就会通过自动构建应用并运行不同级别的自动化测试(通常是单元测试和集成测试)来验证这些更改,确保这些更改没有对应用造成破坏。这意味着测试内容涵盖了从类和函数到构成整个应用的不同模块。如果自动化测试发现新代码和现有代码之间存在冲突,CI 可以更加轻松地快速修复这些错误。
持续交付
完成 CI 中构建及单元测试和集成测试的自动化流程后,持续交付可自动将已验证的代码发布到存储库。为了实现高效的持续交付流程,务必要确保 CI 已内置于开发管道。持续交付的目标是拥有一个可随时部署到生产环境的代码库。
在持续交付中,每个阶段(从代码更改的合并,到生产就绪型构建版本的交付)都涉及测试自动化和代码发布自动化。在流程结束时,运维团队可以快速、轻松地将应用部署到生产环境中。
持续部署
对于一个成熟的 CI/CD 管道来说,最后的阶段是持续部署。作为持续交付——自动将生产就绪型构建版本发布到代码存储库——的延伸,持续部署可以自动将应用发布到生产环境。由于在生产之前的管道阶段没有手动门控,因此持续部署在很大程度上都得依赖精心设计的测试自动化。
实际上,持续部署意味着开发人员对应用的更改在编写后的几分钟内就能生效(假设它通过了自动化测试)。这更加便于持续接收和整合用户反馈。总而言之,所有这些 CI/CD 的关联步骤都有助于降低应用的部署风险,因此更便于以小件的方式(而非一次性)发布对应用的更改。不过,由于还需要编写自动化测试以适应 CI/CD 管道中的各种测试和发布阶段,因此前期投资还是会很大。
个人小结:
持续集成: 高频率的将代码合入主干,在合入之前触发单测和集成测试等去验证代码的改动,确保改动不会对应用造成破坏
持续交付:将代码合入到代码仓库。其目标是拥有一个可随时部署到生产环境的代码库
持续部署:在流程结束时,运维团队可以快速、轻松地将应用部署到生产环境中
CI/CD 的关键概念
来自官网的解释:
Pipelines are the top-level component of continuous integration, delivery, and deployment.
- Jobs, which define what to do. For example, jobs that compile or test code.
- Stages, which define when to run the jobs. For example, stages that run tests after stages that compile the code.
In general, pipelines are executed automatically and require no intervention once created. However, there are also times when you can manually interact with a pipeline.
译文:
Pipelines 是持续集成、交付和部署的顶级组件。
- Job ,定义做什么。 例如,编译或测试代码的作业。
- Stages ,定义何时运行作业。 例如,在编译代码的阶段之后运行测试的阶段。
一般来说,管道是自动执行的,一旦创建就不需要干预。 但是,有时您也可以手动与管道进行交互。
理解
Pipelines 是 CI/CD 的顶级组件,一个 pipeline 创建之后便会自动执行一系列的任务,无需人工干预。而在 pipeline 组件的下面又会有几个子组件 job 和 stages ;其中 stages 定义的是整个 pipeline 有的多少个阶段(环节),这些阶段(环节)的执行顺序是怎样的。而 job 则是每个环节中的具体任务【一个阶段(环节)中可以多个任务】,在定义任务的时候,我们要描述清楚这个任务什么情况下执行以及做什么事情。
接下来我们来理解下《第一个流水线》中的配置:
stages:
- build
- test
- deploy
build_job:
stage: build # 指定job所属stage
image: centos:7 # 指定执行job的所使用docker镜像
tags:
- clf-centos-runner # 指定执行job的runner(即机器)
script: # job执行时运行的脚本
- echo "build project"
test_job:
stage: test
image: centos:7
tags:
- clf-centos-runner
script:
- echo "test project"
deploy_job:
stage: deploy
image: centos:7
tags:
- clf-centos-runner
script:
- echo "deploy project"
以上的配置便是一个完整 pipeline 的配置,那么 pipeline 的 stages 和 job 在这份配置中是如何体现的呢?
首先我们定义一个 pipeline 需要考虑这个 pipeline 有多少个阶段以及阶段的顺序是怎样的?以《第一个流水线》这个 pipeline 为例:
一共是三个阶段:build、test、deploy;这三个阶段合在一起描述了代码上库之后的需要进行的处理,分别是代码构建、测试、部署。
体现在配置上便是:
stages:
- build
- test
- deploy
顺序则是数组每项的顺序:build(构建)=> test(测试)=> deploy(部署)。
在定义了每个阶段之后我们便需要进一步为每个阶段定义相应的 job(任务),以 build 阶段为例:
stages:
- build
build_job: # 这是job的名称
stage: build # 指定job所属stage
image: centos:7 # 指定执行job的所使用docker镜像
tags:
- clf-centos-runner # 指定执行job的runner(即机器)
script: # job 做什么
- echo "build project"
前面提到我们需要给每个阶段定义相应的 job(任务)。那么 job 怎么对应到对应的阶段呢?通过 stage 关键字来对应的:
stages:
- build
build_job: # 这是job的名称
stage: build # 指定job所属stage
stage 的值 build 这和我们前面定义的在 stages 数组下的其中一个值 build 对应,这便说明了 build_job 是 build 阶段的一个任务。
我们还提到了 job 是用来定义做什么的,那么 build_job 这个 job 做了什么呢?看看 script 关键字:
stages:
- build
build_job: # 这是job的名称
stage: build # 指定job所属stage
script: # job 做什么
- echo "build project"
emmm,就简单了输入了下 “build project”。
在前面的配置中还出现了几个其他的配置,我们也顺便来看看其相应的的作用
tags:该字段指定执行该 job 使用的 runner(机器),我们指定的是前面注册的 runner,名称是 clf-centos-runner
image:我们的 job 的执行器(executor)使用的是 docker,这个字段指定的是 docker 所使用的镜像
到这里相信我们已经可以大致理解《第一个流水线》的配置了;整体如下:
整个 pipeline 共有三个阶段 build => test => deploy;我们为每个阶段都定义了一个任务。每个任务都指定了执行任务所使用的机器(runner),并指定了执行器(executor)所使用的镜像 centos:7。目前每个 job 的执行任务都非常简单就是输出对应的文本。
稍微等等,似乎还少了点什么东西。为什么我们刚编写完 .gitlab-ci.yml 文件提交并推送之后便可以看到流水线呢?gitlab 是怎么知道这个时候要执行流水线的?是不是只有改 .gitlab-ci.yml 文件才会触发流水线?那我现在已经写好了以后不会再去修改 .gitlab-ci 文件了,流水线还能触发吗?
这便涉及到了流水线的触发机制,一般来说只要有代码推送都会触发流水线。当代码推送到远程的 GibLab 仓库时,GibLab 会看有没有流水线的配置文件 .gitlab-ci.yml,如果有的话便会触发流水线(当然我们可能在配置进行了特定的配置使得流水线不创建)。除了代码推送,我们还有其他的方式可以触发流水线。如:定时任务、手动触发、通过调用 GibLab 的 api 的方式触发等。
结语
通过前面的内容我们已经创建了测试用的项目,安装好了相应的环境,并写了自己的第一个流水线也理解了 CI/CD 的基本概念。相信大家对 CI/CD 已经有了一个比较完整的认知了。后面的章节我们将进一深入 CI/CD 核心概念的学习。