蚂蚁金服-平台研发高级工程师/专家内推邮件请发送至 xiaogang.xg@antfin.com ,有疑问可以随时联系有问必答!

SRE(Site Reliabilitiy Engineering)是结合传统软件工程与系统运维形成的新的技术体系,用以组建大规模高可用的分布式系统。蚂蚁基础设施中间件SRE团队的使命在于确保基础设施在快速演进的同时,具备高可用性以及扩展性。团队从高可用的角度切入到基础设施各部分组件的研发设计,通过工程化手段来优化生产运行中低效,繁复的操作,并致力于建设完善的监控体系以提高故障处理效率。

团队介绍
1. 负责自动化体系的建设。如快速部署变更、自动恢复、自适应容灾等,提升技术效能;

2. 负责双十一等重大活动保障,保障海量峰值下用户体验丝般顺滑,同时确保成本可控;

3. 负责人工智能和大数据领域新技术探索及落地,如资源调度、存储计算分离、离在线混部、分布式计算等。

此职位P6、P7、P8均有需求

职位描述
1. 3年以上的大规模集群管控平台开发经验,掌握至少一门编程语言。Java、Node 优先;

2. 具有监控及自动化部署平台研发背景者优先,具有大规模集群调度和架构设计经验优先;

3. 对云平台有了解,有 IaaS/PaaS/SaaS 背景者优先;

4. 对网络及基础设施层有一定的了解和知识储备,熟悉 Linux 系统和 Shell

5. 有 Docker、k8s 及资源调度经验者优先;

6. 有产品经验优先
展开
评论