阿里云周晶:我是如何选择技术方向的?

303 阅读16分钟
  1. 简单介绍自己

GIAC 的朋友们大家好,我叫周晶,花名治先,目前在阿里云边缘云原生团队负责边缘云容器平台的建设与落地工作。这些年,我一直从事后端系统架构高可用、高并发、服务化、ServiceMesh、资源云化、服务容器化以及云原生等相关的工作,算一位后端开发老人。

2011 年跟着当时开心网老大一起创办创业技术社区 “iDev 创业技术沙龙” 那会儿还不叫 MeetUp,所以一直网络 ID 就是 iDevz。第一次接触了高可用、大并发,也认识了很多业内大佬,有了很多学习精进的机会。

2012 年在一次架构选型过程中接触到了 OpenResty,真正意义上在工作中去实践大并发,后面的多年一直围绕 OpenResty 做了很多事情,同时见证和参与了 OpenResty 社区早期的建设和发展过程,第一次感受到社区的力量。2012 年刚去新浪那会,我自己一个人天天捣鼓 Lua,为了把大家掰到 Lua 栈还开发了一个类 PHP Yaf(鸟哥的代表作品)的一个 OpenResty 框架,最终成功推动了新浪移动多次大规模架构升级。

2016 内部转岗到微博,负责微博跨语言服务化的建设和落地,当时还不叫 Mesh,我们开始的时候还没有现成的 Mesh 方案,Linkerd 也刚起步还不知名,Istio 那是后面的事儿了。

2017 年将微博跨语言服务化体系整合为 WeiboMesh 开启了 WeiboMesh 开源共建与落地之路。后面因为个人理解云计算已经大量挤压传统后端架构师的生存空间,我所醉心的高可用、大并发、服务化这些技术以及很成熟,且被云厂商产品化,但是考虑到自己兴趣所向,索性直接到云厂商再续前缘。

于是,2020 年我决定来到阿里云,选择了一个自己认为最有前景的方向,主要考虑两点,希望今后的日子能在一个领域深挖,做些更有意义的事情。另一方面,我认为边缘计算是与传统消费互联网相比真正意义上可能影响工业、产业的战略性技术,也我目前为止所了解的最有可能颠覆性并改变人们生产生活的技术。

后面的日子希望能跟大家多多交流学习,谢谢大家。

  1. 聊聊你最近一年正在做的项目,它的技术价值怎样?它的行业发展状况是怎样?你负责项目的技术亮点和挑战能否展开讲讲?

来阿里云边缘云刚好一年多,这期间一直在设计和建设阿里云边缘云容器平台,并推进CDN 与边缘计算融合以及 CDN on ENS 项目的落地。

从去年开始尤其是今年能明显的感觉到 5G 边缘计算的热度在急剧升高。边缘计算也越来越多的被人们所接触。但是大家也都很清楚,当前 5G 的覆盖与商用规模并没有起来,还没有非常多的应用落地案例。但不论是从国家规划还是社会发展层面来看,边缘计算都是大家公认的核心战略方向。

对于阿里来说我个人理解有两大核心优势,一是阿里云从 2016 年就开始从 IaaS 层面起建设飞天边缘操作系统底座、探索边缘计算的各种可能性,加上阿里 CDN 十多年的沉淀,有非常深厚的技术以及资源积累,而且阿里云是目前我所了解唯一一家真正做到 CDN 和边缘计算融合的厂商。另外就是阿里巴巴经济体庞大的业务生态,我们有各种超大规模的边缘业务场景,通过各种业务场景去建设和打磨我们的边缘云平台。

我理解的,边缘云是由大规模地域分散的边缘节点相互协同组成的一朵可远程管控,安全可信,标准易用的分布式云。而我的主要工作就是基于阿里云边缘云的基础资源底座对全域边缘节点资源进行云化,并基于这个分布式多云异构融合的云化底座构建多租隔离的 IPaaS 边缘云原生基础平台,支撑CDN产品服务、云通信、视图计算、云游戏、云桌面、云智能终端等各类场景业务。

这里面有几个比较有意思也有挑战的点。例如,如何通过一套统一的基础平面来对各种层面的异构、分布式多云进行抽象管理?如何在边缘单节点资源、网络等受限的情况下为用户提供可靠、丰富的边缘云原生服务?最重要的还有如何保障满足这一切需求的整体架构设计基本可演进、可迭代的灵动?边缘所面临的这一系列问题都是因为边缘云节点资源的广覆盖、小型化、网络环境复杂、资源网络多种多样等特性所致,边缘异构资源、边边云边网络的不可靠等等因素引申出边缘云两大核心技术课题:融合与协同,这两个问题将始终贯穿我们平台建设的整个过程,为了解决这一系列边缘核心问题,我们设计构建了阿里云边缘云计算平台。

  1. 在技术方案落地的过程中,你通常关注哪些问题?如何保证技术方案顺利实施?

在技术方案推进前一定要保证系统设计是基于对业务的深入理解,对现状的细节摸盘,整体方案有短中长期规划,系统设计之初就细致考虑清楚可能的问题点并做好相关扩展点的设计以及相关配套(稳定性、可观测性)依赖的梳理,配套的建设在推进过程中也不能少。这些是技术方案能高效优质推进落地的前提。

我理解技术方案落地的过程,更多的是方案逐步验证与对焦的过程,进展信息的通畅与阶段性复盘就显得尤为重要,我个人认为好的方案和系统一定不是设计出来的。架构师基于对业务(需求)、现状(资源配置、环境拓扑)和未来(短中长期发展规划)给出一个灵动可扩展的架构是方案落地的基础,系统的稳定性保障和务实的落地节奏是保证技术方案顺利实施的不二之路,过程中长效的沟通与复盘机制,定期帮助参与各方找准自己的位置发现系统当前推进的问题并针对性的解决,促进整体推进进入一个良性循环,顺利实施就会变得水到渠成。但是这个过程中也会困难重重,尤其是机制的设计与执行的坚持。时间是最可怕的一个东西,一鼓作气,再而衰,三而竭,阶段性的里程碑的一个不错的调和剂。

  1. 架构师在最近的技术变化的浪潮中,需要面对的挑战都有哪些?如何应对这些挑战?

最初我的职业生涯选择成为一名后端架构师的初衷是以为后端架构师只需要吃透业务,深挖技术就可以了。那是一个开发人员最朴素的一个期望。希望每天都以机器和代码为伍,心无旁骛,解决各种有意思的技术问题。

但是现实显然不是这样的。尤其在我最近一次换工作期间考虑过跟朋友一起创业,起初也一起参与了多场早期创业拉投资的各种事宜,在整个找钱的过程中,我渐渐深入理解了资本逐利背后的逻辑。总结一条就是任何组织和个人都要清楚自己的核心价值,为这个社会创造了什么价值解决了什么痛点问题。比如德邦物流他的核心肯定是整个物流业务,IT 设施只是他的辅助管理工具。新浪新闻的核心价值是为用户提供更实时,千人千面的咨询服务,至于这些服务运行在什么地方只要是稳定可靠的,应该都是满足业务需求的。

我很庆幸自己这么些年一直都专注后端架构这个方向,从单体应用到微服务架构,从物理机、多机房部署的物理架构到分布式多云资源云化云原生架构,服务化从 RPC 到 ServiceMesh 等等见证并深度参与了各种架构、技术的转型、迭代的全过程。这一系列技术变化的浪潮背后推进的动因我理解有 2 个,一个是资本逐利驱动组织一直追求降成本和提效率,另一个是社会化分工越来越细。这一切都是很自然的选择。

架构师在这个大背景下,我认为最重要的有以下几点:一是要摒弃技术理想主义,心里要始终明白所有的技术都是为业务服务的,技术服务业务,业务服务商业;一是在当前云计算、云原生技术普及普惠的大潮下,要与时俱进,基于对自己组织核心价值的深入思考,明确技术建设是否是组织核心竞争力,及时切换思路,基于云计算、云原生、或者混合云来设计自己的架构才是最佳路径,通过良好的架构设计来节省组织运营成本,提高服务维护效率。一是保持对技术的敏锐嗅觉,并持续学习,唯有不断的刷新自己的知识体系,找准自己的定位,才能更好的实现自身价值。

  1. 在做技术选型的过程中,你经常考虑的问题有些?

最核心的一点我认为是业务的理解、需求的挖掘和现状的梳理。这是技术选型的前提。在选型前一定要明确我要解决的问题的本质是什么?另外就是对选型相关的技术或者方案对我要解决的本质问题的抽象模型是怎样的?当前方案具备哪些能力?对解决我们的问题有哪些帮助?对应的解决方案和技术的引入带来的可能的副作用是怎样的?是否有简单可应对的方案?引入的成本是怎样的?整体选型的结论是否保证相对简单,可维护,可扩展,可迭代?稳定性能力是否易于保障?

  1. 云原生领域你看好哪个项目或技术,为什么?

我本身就从事边缘云原生这个领域,虽然边缘云原生是利用云原生的理念在边缘云构建边缘原生的技术基础设施及行业生态,它本身不止是云原生,但是很多技术都是相通的,而且很多技术我们也是愿意到边缘来尝试甚至是复用的,所以对我来说云原生领域的各种高价值的项目和技术简直是太多了。

如果一定要探讨我最看好的,首先最核心的我认为要看这个项目或者技术解决了哪些核心的问题?同时是否解决了我场景里的一些痛点问题?这些问题对整个云原生体系是否有着或有可能会有深远的影响?

举个例子我们在做边缘云容器平台的时候,因为考虑到要为租户提供多租隔离的 K8S 服务,同时我们又要同时纳管全网目前就已经有的几千个 IDC 中好多 W 台的设备,单 K8S 集群肯定搞不定,VirtualCluster 项目就给我们带来了很多大规模与多租 K8S 的思路,我理解这是当前多集群管理的最佳实践方案。再比如 OpenYurt,解决了 K8S 在边缘环境生产过程中所遇到的一系列比如脱网自治,比如单元化管理等等问题。这些技术都在阿里云被产品化对外服务,我认为被云厂商选择并被产品化本身就是对这个项目或者技术的最大的认可,因为产品化的过程需要云厂商投入很多研究、维护的成本,任何组织都不会为没有价值的东西买单的。

  1. 请谈谈你最近关注的一些技术热点,并且谈谈你对这些技术热点的看法

我最近比较关注 DDD、WebAssembly 和 Dapr,DDD 领域驱动设计可能是未来边缘计算真正大规模在工业、产业界落地的一个有力的框架方法论支持,虽然随着工业界、产业界的不断完成信息化、数字化升级并在智能化的路上深耕,但是领域的专业、垂直化技术知识 与 IT 基础设施的迭代演进矛盾逐渐凸显。DDD 给领域专家和 IT 技术专家提供了更明确、具体的交流原语、框架支持。

而 WebAssembly + Dapr 被认为是下一代云原生运行时,我对这一点笃信不移。跨语言、可移植、轻量化、高性能、安全隔离的运行时将为各种边缘异构场景提供强有力的运行时支持。

  1. 请介绍下你这次在 giac 演讲的议题或者负责的专题内容

很高兴自己受邀作为本次 GIAC 大会 边缘计算 专场的出品人出席本届 GIAC 大会,因为当前 5G 边缘计算还处于早期落地初探阶段,在议题选择上我的一个主要出发点就是希望能邀请到不同界别的嘉宾,从各自所在的立场(领域)出发,从不同视角为大家全方位的解读当前 5G 边缘计算发展现状与落地的整体情况。

很荣幸本次能从产、研、运营商与云计算厂商 4 个界别分别邀请到了相关资深的各位专家来给大家做分享。在这里请容许我为大家隆重介绍各位分享嘉宾及议题。

首先我们很荣幸的邀请到中国信息通信研究院高级工程师 王哲 博士,信通院一直作为 5G 边缘计算标准的引领者和指导者,作为指导国际标准本地化落地的权威机构,信通院对 5G 边缘计算的理解将推进和指引行业更好的发展,本次大会王哲博士为大家带来题为 《边缘计算发展态势与应用实践》,帮助大家掌握边缘计算整体发展态势,了解边缘计算在工业互联网应用现状及关键技术发展趋势,了解我国首个边缘计算产业项目“边缘计算标准件计划”最新工作进展和未来计划。

5G提供的高性能无线数据连接、本地数据分流等能力为边缘计算所能支持的业务场景提供了无限的可能,而边缘计算本身又是5G的核心业务场景之一。5G与边缘计算的结合,是CT与IT深度融合的一次重要尝试。5G边缘计算在行业应用的落地,离不开运营商传统基础网络建设的推进,但更离不开CT 与 IT 技术的结合、网边云协同等方面的突破。本次有幸邀请到中国移动研究院主任研究员 宋月 老师为大家带来题为《5G边缘计算业务场景、技术体系及应用探索》的分享,帮助大家了解 5G 边缘计算与行业应用的潜在结合点,了解运营商 5G 边缘计算技术体系,基于此探索更多的合作方向及合作模式。

如果说信通院给大家带来的是标准化与方向性的指导,运营商给大家带来的是 5G 整体基础设施建设的实践,那产业界的真实落地案例一定会给大家带来更多参考和借鉴价值。而我们有幸邀请到招商局集团有限公司 数字化中心 技术专家 山金孝老师为我们带来题为《大型传统企业边缘计算建设实践与思考》的主题分享。重点分享大型多元化传统企业招商局集团在数字化转型过程中云、网、边、端协同建设的经验和挑战,探讨边缘计算在传统企业数字化转型中的价值意义,以及建设实践经验的分享。让大家更深入的了解大型传统企业数字化转型中的技术架构思路,了解分布式混合云在大型多元化企业中的应用以及边缘计算在大型企业中的探索与实践。

最后我将为大家带来题为《阿里云边缘云超大规模容器平台实践》的技术分享,阿里边缘云作为目前业界唯一一朵实现了传统 CDN 业务与边缘云融合的,分布式异构多云融合的,标准易用的分布式云,本次分享主要聚焦在分布式异构多云平台的云化与融合,以及基于此建设的边缘云原生 IPaaS 平台与业务落地过程中的一些最佳实践。最后简要分享当前阿里边缘云所具备的一些值得一提的边缘云能力。助力大家更好的落地边缘云。

  1. 对本次 giac 有什么寄语

虽然本次是第一次以出品人的身份来参与大会,但我早就是 GIAC 大会与高可用架构社区的老朋友了,从跟随高可用架构社区一同打怪升级到现在一起携手共进,希望 GIAC 大会和高可用架构社区越办越好,希望中国的开源技术社区越来越活跃,薪火相传,为咱们国内的技术环境贡献更多力量,希望 GIAC 砥砺前行为大家带来更多优质的内容。

欢迎关注2021年7月31日GIAC全球互联网架构大会边缘计算分论坛。

PS:如想了解更多关于阿里云边缘云的业务,可钉钉搜索加群35469210