如何利用开源DevOps工具完成云上的自动运维

988 阅读8分钟


内容来源:本文内容来源于黎山阿里云栖社区-运维/DevOps在线技术峰会上的主题演讲,IT大咖说为独家视频合作方。
阅读字数:2916 | 15分钟阅读


内容概况

云计算的特点是开箱即用,可以随时的扩缩容,不用考虑硬件的损坏问题,也有丰富的云服务和云平台供我们选择。在本次演讲中,黎山通过实际应用场景为我们讲述了基础设施及代码的重要性,以及在云计算的运维中,如何利用工具来实现自动化,提高效率。

嘉宾分享视频地址:t.cn/RX8IwrA

大家好,今天我们围绕几个议题展开:

  • 通过实际的应用场景来讲解IaC的重要性。

  • Terraform、Packer的使用介绍。

  • 多个工具组合案例+操作演示。


实际应用场景

应用场景解析一

某应用为了增大吞吐量,做了流量的均衡处理,在整个的基础设施架构中,选择了两台ECS挂在SOB的一个基础设施。如果要实现这样的一个架构,需要做以下8个步骤来完成这些基础设施的搭建:创建ECS、创建安全组、添加安全组规则、创建SOB、添加后端服务器、配置监听端口、配置会话保持、添加健康检查。要通过这八个步骤来完成两个ECS挂到SOB上面的基础设施搭建。


应用场景解析二

应用二的特点是需要做网络隔离,所以要把它整个的应用架构搭在VPC下面。它有对外访问网络的需求,同时也有应用对外提供服务。如果要实现这样一个基础设施的话,大的步骤是需要以下七步:创建为PC、创建VSWITCH、创建NET网关、新建共享带宽包、创建ECS、创建SLB、创建SNAT、最后挂载SLB。中间省略了若干个配置操作。


应用场景解析三

应用三与应用二是一样的基础设施要求,就要按照固定的流程再重新做一遍重复的这些操作。

应用场景解析四

随着应用的增加和业务的发展,我们的基础设施的资源也在增加。我们希望能够把应用和基础设施做一个分组,也就是通过打标签的方式,把哪些资源属于哪一个应用做分类。


应用场景解析五

随着业务的发展,应用二深受市场欢迎,流量也暴增。就需要增加ECS以承载更多的并发和访问量,所以需要扩容一台与线上应用一致的ECS挂载到SOB上面,这里的一个关键点是扩容一台与现上应用一致的ECS。

按照传统的操作方式,先将已经安装好应用的ECS打上快照,然后生成镜像,基于此镜象创建ECS,再添加到SLB当中,同样这里面省略了若干的配置步骤。


场景总结:

通过以上几个场景可知,它们的特点就是,操作流程是有序可循的,并且配置是固定的。如果全部是手工操作的话,会带来以下缺点:效率低、时间长、可能导致错误、变更不能回滚、过程中没有历史记录、过程不能审计。

针对场景五的IaC思想。场景五的一个需求就是要扩展,扩容一台与线上应用一致的ECS。如果用IaC的思想,操作流程应该是利用Packer创建一个镜像,在打镜像的时候,把提供服务的应用打到镜像当中,然后用Terraform创建ECS以及其他资源。在创建ECS的时候,选择Packer打出来镜像ID。在变更的时候,我们只需要修改Terraform的模板,把ECS变量的参数加一,执行变更就可以了。就能够实现扩容一台与线上应用一致的ECS并且自动挂载到SLB下面。


Terraform 和 Packer 的介绍

它们来自于HashiCorp家族,有两大特点,第一是支持多平台,第二是开源。现在主流的云平台像阿里云、AWS、Azure等都已经支持了。另一个开源的好处是成熟、透明、可自增强。


Terraform最重要的一点就是模板,模板里面最重要的就是resource。resource是来描述资源,它后面有两个字串。第一个字符串是资源名称,这个名称是固定的;后面的一个串代表的是别名,别名可以自定义。我们就以这个模板为例来详细讲解一下,怎么通过模板去描述一个把资源的定义。

首先看一下安全组。安全组的规则可以定义出网或者入网规则,它的端口是多少,指定的规则作用在哪一个安全组上。也就是对security_group的一个引用,还可以指定它的网段。

对于ECS来讲可以指定instance的name,还有它的镜像ID和count。前面说如果应用于场景五,我们如果想扩容一台的话,我们就在count数加一,它就会自动创建一台ECS,可以指定这台ECS所依赖的安全组。SLB同样是指定它的name以及网络的收费类型,它是公网SLB还是私网SLB,还有对它监听的一些配置。

最后一个是SLB的挂载。这里定义了SLB和instance这两个主要的参数,也就是要把哪些instance挂载到SLB下面。


Terraform最重要的三个命令就是PLAN、APPLY和DESTROY。Terraform的意义是执行之后会看到资源的所有的参数值以及要创建哪些资源,如果确认没有问题的话,就执行APPLY去真正的创建这些资源,然后通过DESTROY做销毁。


我们通过一个实例的操作演示来看一下,创建一个VPC集群的。Terraform在运行时是怎样的状态。这个整个的基础架构是一个VPC集群,有一个子网,子网里面有一个ECS,有安全组、安全组规则,通过NET网关和共享带宽包来实现子网出网和入网的能力。

首先执行Terraform plan。我们要预览一下要创建哪些资源,一共有八个资源会被添加。确认没有问题的话,我们去执行Terraform apply,这个时候就会实际的创实际的创建这些资源。创建完成之后会返回带宽包的两个ip以及instance的ID。


Packer主要的思想也是通过模板来定义一些内容,然后创建镜像。Packer会通过模板自己来决定是基于阿里云的基础镜像创建还是基于自定义镜像创建,然后会自动创建一个经典网络的ECS或者是VPC网络的ECS,同时会根据模板的定义在ECS之上去添加这个去安装相关的应用,然后把ECS打一个快照,根据这个快照生成镜像。当镜像创建完成之后,会把它中间所用到的这些资源都释放掉,可以再做进一步的操作。

Packer模板最重要的就是两部分,一个是builders一个是provisioners。Builders的type来决定她创建的这个镜像是给哪里用的。Provisioners定义的就是镜像中要处理的任务。Packer的命令最主要的就是Packer build的一个指定目录的json。在执行完build之后会提示镜像创建完成并返回镜像ID。


多个工具组合案例

用Packer制作镜像,制作镜像之后会生成镜像ID,然后用Terraform的模板镜像ID创建ECS,这个ECS就自带了所要提供的服务的应用。这个好处就是一次制作重复使用,免去每次创建机器来重复安装服务的过程。也可以用Packer把应用打在镜像当中,然后通过ESS去做伸缩。很多用户在做弹性伸缩的时候呢会遇到一个麻烦,就是在最初的时候,ECS所用到的镜像是只有一个操作系统的镜像,是没有服务的,创建出来之后不能够直接使用。如果结合Packer,Packer把这些应用打在镜像当中,然后用Terraform或其他工具,在用弹性伸缩的时候直接是基于已经安装好应用服务的镜像去做伸缩。另外一个工具就是把Terraform和Ansible结合,一起去实现这个组合。



自动化的实现路径共有三条主线。第一条线可以利用Packer去而生成镜像,自动的存储到自定义镜像列表当中,然后用Terraform创建更新或者销毁这些基础设施。在创建ECS的时候,我们可以选择Packer创建出来的那个镜像ID。在运行期我们可以使用Ansible去管理这些基础设施或是ECS上的应用。


用代码描述基础设施的好处就是,代码编写好,验证也是正确的,之后每次执行任务都不会出错,并且快速高效。还可以用代码代替文档,并且也有历史记录,可回滚。不用担心文档更新不及时或者是人员流动带来的一些问题。而且不用通过访问生产环境就能够知道生产环境上的配置情况,也可以提高整个团队DevOps的能力。

今天的分享就到这,谢谢大家!