从平凡到非凡 阿里云李克的技术进阶之路

588 阅读13分钟

简介:人物简介:李克 阿里云边缘云计算领域技术负责人 2009年硕士毕业加入阿里至今,一直从事CDN及边缘云领域的技术研发工作,在CDN、边缘计算等方向上有丰富的行业经验,全程参与了阿里云CDN商业化转型,边缘云中台体系的建设,研究方向包括数据智能、分布式架构和性能优化、云计算等领域。目前主要负责边缘云的技术研发以及架构演进。

2014年,李克临危受命,负责阿里巴巴上市的内部直播项目。

当时整个CDN平台还没有直播系统,需要在不超过1个月的时间内,把直播平台搭建起来。李克基于开源的Nginx Rtmp搭建了具备容灾能力的直播系统。由此,阿里巴巴也开启了CDN的商业化直播产品之路。

次年,阿里云开始转战CDN的对外商业化之路。

在CDN转型的过程中,李克也迎来了人生中的最大挑战——云CDN。

“当时我们提出了要支撑百万域名的口号,但平台还停留在几千域名的服务能力上,配置也变得更复杂,数据量的剧增……原来系统的很多问题都在此时显现出来了,很多时候配置无法生效,数据库也不可用,我清楚地记得,那时候经常半夜三更起来开始恢复数据库。”在商业化之前,阿里每年的双十一大促都能顺利得到支撑,但随着商业化的来袭,其业务规模瞬间就上了一大量级,SLA标准也随之提高,以前服务内部的技术瞬间被“打脸”。

提起那段“不太平”的时光,李克依旧提心吊胆。

一方面,李克和其团队需要全面拥抱云计算,把自己搭建的数据库、中间件等服务,使用阿里云的标准产品做大量迁移。另一方面,他们还要对原有系统做相关治理,把高并发、分布式、异地容灾等一个个概念变为现实,除了提升单个组件能力外,他们还需要在系统的可观测、可运维行上做大量工作。

“当每天收集分析的数据量超过10PB,就会使得我们的白屏化和自动化也得到大幅度提升。作为技术人员,一定要做好技术的判断和选择,聚焦在核心问题上,用最少的投入来获得最大的收益。”李克坚定地说道。

最终,在李克和其团队的齐心协力下,**2018年,阿里云做到了真正服务百万域名,每天支持超过50亿次的消息全球下发,配置秒级生效,从以前的5分钟提升到了秒级时代,提升效果突飞猛进。**客户在做配置发布和内容刷新时,无需等待。同时,CDN使用门槛也大大降低,成为了云计算时代的普惠技术。

李克既是万千普通人中的一份子,又是从小白长成的一位非凡技术大咖。

兴趣是最好的老师

李克从小就对计算机“情有独钟”。第一次在高中接触计算机时,当时由于技术有限,无法上网,**他只能用office上机练习打字,背五笔和各种快捷键……但这些就足以让他沉迷其中。**后来,每次上机课,他都一直玩到关门才走。也就是此时,研究计算机的想法在他内心深处油然而生。读大学期间,他拥有了自己人生中的第一台电脑,这也由此打开了通往计算机和互联网的大门。

“我对于计算机、互联网还是比较痴迷的,记得有段时间学习做网站,捣鼓各种bbs和cms源码,在网上申请各种免费顶级域名和托管空间等,在大学里也担任很长时间校内bbs版主,开始接触脚本和linux操作系统,当时很多内外网资源就是自己写爬虫获得的。”李克说,带着兴趣去做事情是最有效的学习捷径。

积跬步之千里,小白终成技术大咖

“我的职业发展是从点到面,再到点再到面,一个不停循环往复的过程。”李克说道。

2009年7月,李克硕士毕业后,顺利进入阿里巴巴,加入CDN行业。

“在云计算的历史车轮里,CDN需要实现转型,从传统的服务模式变为云CDN的模式,将CDN使用门槛降低,使用体验提升,从而变为一个普惠的技术。所有的技术和行业都不是恒古不变的,要用发展的眼光看待当下的现状,与其等着被动降维打击,不如主动创造和拥抱变化。”李克说。

刚开始做CDN时,李克负责监控和配置模块。在谈到写程序时,李克说,做程序员写代码有种成就感,特别是当自己的系统和代码被很多人使用时,当看到线上每台机器都有你写的代码时,能给线上运维和客户带来极大便利时,尤其在日常使用中,看到自己的想法变为现实……这种归属感和解决问题的成就感是非常受用的,同时这也是对程序员最大的鼓励。

时间一晃来到了2019年,随着业务的发展和时代的变化,为了解决更深层次的问题,李克开始转型做边缘云,这也意味着他从业务平台到基础平台的转变,代表着需要更扎实和底层的技术,来支撑上层的高楼大厦。

“在CDN摸爬滚打多年后,最大的痛点就是整个资源的利用效率和业务发布效率等问题都急需解决,而CDN领域却无法根治这些问题,这就需要调到更高的层次来解决。”就这样,李克开启了新的边缘云的方向探索。

我希望边缘云能做成基础设施,把我们多年在CDN和边缘节点上的能力变为通用能力,业务可以像搭积木一样灵活使用,也能像水电一样快速安全,用之不尽”,谈到这次转型,李克悠悠地说道。

在见证了CDN的十几年技术演进过程中,李克争取在垂直化领域里做到了最好,同时自己也从小白长成了技术大咖。

以必成之心,创未有之业

起初,CDN 是从内部开始服务淘宝,后来,逐渐变为阿里云的产品对外商业化。经过十几年的业务发展,推动了技术的变革,CDN行业发生了翻天覆地的变化。

从最开始基于开源haproxy、squid,逐步演进到更自主可控的Tengine、Swift,节点内的四七层负载均衡架构,优雅的解决了流量不对称问题,单机上的web软件和存储软件混部高效利用了单机资源,这也已经成为了CDN行业的标准架构。

随着CDN的体产品系演进的突飞猛进,它从传统的1.0静态加速到2.0动态加速,再到安全、视频、移动等多场景的的CDN加速服务,这其中需要基础软件升级和大量的周边系统支撑,最终李克和团队沉淀出来了边缘的中台技术,能举一反三的横向复用。

除了产品形态丰富之外,资源使用方式也逐步进化,节点和机器资源混用到物理隔离,再从物理隔离演进到逻辑隔离,目前CDN已经全面拥抱了云原生的体系,以容器和服务发现的方式快速部署业务,高效低成本的使用资源,这些发展都是业务规模和效率带来的必然要求,促使了边缘技术体系的变革。

通过体系化的建设,在2018年世界杯比赛上,云CDN做到了无需太多的人值班,基于多年的数据能力,配置发布,监控工具等,当系统遇到突发问题时,可以快速地进行科学决策,一边盯屏一遍看世界杯就完成了值班护航。

“世界杯是一场大练兵,可以很好地体现了我们对突发的大流量活动的功底。”李克说。

后来,李克在回忆起采集系统和应用数据时说:“受传统采集方法限制,无法灵活支持新的埋点和软件,他第一次萌生通过框架解决扩展性问题,随即他动手写了Tsar。”利用动态库的方式,灵活加载采集模块,每个场景只需按照标准写好采集和展示规则,就能快速的使用Tsar的通用能力,在业务多变、快速发展时,Tsar发挥了巨大的作用。

目前,Tsar系统还是阿里巴巴集团的基础监控软件之一,每个服务器上都有部署使用。

起初,李克设计Tsar开源的初衷是为了帮助遇到同样困境的人。在此期间,他也收获了更多志同道合的朋友。“大家一起做同一件事,解决同一个问题,有共同的爱好和兴趣。”这种归属感让他特别满足。

除了成就感和归属感之外,还有一种非我模式的历史责任感。“我觉得这件事情有可能成为现实,而自己刚好在风口浪尖,那就豁出去,干就完了。包括我在做的边缘云计算,是下一代的边缘基础设施,是未来CDN发展的必然趋势,因此也是值得我all in在这里面的,就像现在回想做CDN商业化一样,重新创业,重新启程的感觉非常新鲜和兴奋。”

顺势而为,见证新技术浪潮的来临

为了解决更深层次的问题,李克开启了个人转型——做边缘云。就像当年需要云CDN一样,如今边缘云也是时代的需要。

随着云游戏、视频监控、5G等边缘业务发展,逐渐出现了边缘场景的资源和计算需求。而对边缘云来说,用户需要的是算力、存储、网络、安全能力互相结合的一个综合性的服务。

而从CDN和边缘云的关系来看,CDN是具体的一个场景的应用,而边缘云则是一个底座。

阿里云希望CDN能跑在边缘云上,阿里云边缘云也在不断升级和改造,在边缘云上,提供丰富的组件能力,在此基础上对CDN业务做出编排,以更好的服务CDN业务。同时,边缘云的服务让CDN可以完成高效的资源复用,让资源更有弹性。

此外,边缘云的应用场景还可以从内部和外部两个角度去看。其中,内部业务主要是CDN业务,目前已经全面基于边缘云体系来构建。而外部业务则更多的是新的业务场景探索,比如在终端上云、5G等场景下,就需要更快的数据上传以及指令下达,需要就近处理,边缘云优势就得以凸显。

例如,在云游戏、互动直播场景上,用户在端上操作,边缘结点要快速做出快速,以流式的方式传输给用户。同时在一些垂直化的行业中,如智慧交通、智慧医疗、工业制造等场景是具有区域性特征的:所有的节点都处于一个区县或者地域中,数据是一个本地化的产生与消费。所以,同样需要边缘云的存储技术来支撑业务场景。

未来5年,边缘云会朝着广覆盖、低延迟、互联互通的方向发展,广覆盖指的是节点更靠近客户,节点数量会到达百万规模,低延迟是提供<10ms的网络延迟,互联互通是能够将所有的边缘云节点形成一张网,一个资源池,统一的对外提供资源以及业务部署交付能力。

找准定位,寄望未来

只有知道世界上做的最好是什么样的,才有机会赶超,如果有人已经做到了行业第一,就要明确竞争壁垒是什么,以及如何自我颠覆,持续创新。”李克说,只有明确了定位,才能知道自己该往什么方向深挖技术,做大业务。

平时,要多关注相关领域的优质作品,提升自己的视野和认知水平,建立内外部的技术圈子,学会经常总结,多分享,提升个人专业影响力。多订阅一些技术大牛的动态,看看大家关注的行业技术和前沿趋势,知道行业里面最好的人都在干什么,想什么。比如我们团队现在做边缘云方向,就需要大量学习云原生、虚拟化相关的技术。

此外,形成自己做事的“套路”,注意方法的沉淀和数据上的证明,系统优化运用相关的创新技术,如何复用技术,以及沉淀和被复用都是个人能力的体现,而不是简单的解决问题,要学会体现解决问题背后的技术选型和关键挑战,通过这些方法的提炼,从而形成了做事情的套路。

最后,要学会合作和利他的精神。随着业务变得复杂,分工也越来越细,如何整合资源,利用现有能力,学会“利他思维”,就变得尤为重要。当一个人把全公司都看成他的资源时,或者能让他的价值被广泛应用,那他的成果将不可限量,重要的是学会思考技术怎么复用,而不是重复造轮子。

李克认为,找对方向,放平心态,切忌追逐风口,看到风口之后的本质,风口固然很重要,但来得快也去得快,这种踩空是非常不值当的,要学会更多关注地基础东西,如基础的语言、数据结构、算法等,打好基本功,扎实掌握书本上的东西,只有基础牢了,上面才能生长出更多业务。

有时,选择一份职业,就像在大海上航行时,你需要选择适合一艘适合自己的船,才能到达胜利彼岸。阿里云边缘云所在的海域,或许风云变幻、风起云涌,但值得有人乘风破浪。

“欢迎优秀的同学加入我们,一起在云计算的大海中乘风破浪!”李克最后说道。

原文链接

本文为阿里云原创内容,未经允许不得转载。