因为业务飞速发展,团队快速扩张,应用数量快速的达到了400+,为了更好的保障业务稳定,做好技术支持等工作,计划推进工单平台、资产管理平台的的建设,下面介绍下这两个平台的相关情况。
资产管理平台
现状及问题:机器、应用信息,数量较多,没有统一的查询、记录平台,部分告警找不到关联的开发、测试。有问题并不能及时的联系到相关人员进行排查。
- 问题1:信息比较多,没有集中的平台进行维护,信息老旧,人员更替,信息丢失等
- 问题2:其他平台的使用相关信息没有统一,有丢失、遗漏
平台化建设:为了解决上述的问题,运维团队推出资产管理平台CMDB,对相关资产进行统一下的记录,维护。
资产信息:集中维护了机器资源、应用资源、人员信息
用户管理:用户登录接入了LDAP、同步钉钉的组织架构。
工单平台
现状及问题:日常运维的变更、操作都是通过邮件进行,有时候,开发、测试只是当面说一下,没有办法进行记录、分析,部分审批过度繁琐。
- 问题1:重要变更无审核、无记录
- 问题2:历史变更无法进行分析该井、优化
- 问题3:审批流无法评估
- 问题4:自动化程度不高,操作变更不规范
平台化建设:
为了解决上述问题,运维团队推出了工单平台,建设完善相关的流程,根据不同的流程来设置不同等级的审批流,加强自动化操作的完善。通过平台页面的操作即可以完成相应的操作,对于无法自动化的操作,则进行手动变更。
流程分类:自助操作类、账号权限申请类、配置变更类、版本迭代类等
流程表单设计:对不同类别流程设置不同的审批流
流程分析:定期对操作变更进行分析,与产品、开发、测试团队进行沟通,不断改进。
通过工单平台,固化了运维和测试、开发、产品的日常对接,工单平台成为运维对外的主要窗口;而资产管理平台则对运维的数据进行集中化管理,避免使用的时候无处查询、有了丢失的情况。