“云网管” ---云上构建网络自动化体系

2,046 阅读7分钟

简介:云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

1.背景

云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

1.1用户痛点

1.安装部署难

传统网管大多都是本地部署,用户需要负责物理资源规划、中间件安装、安装包部署等等工作,通常需要专业的网络和IT维护人员数天甚至数周才能部署上线。

2.集中管理难

网络设备自有的厂商网管,一般只能提供本地web访问方式,不能集中管理,更做不到跨厂商管理,无法给用户提供统一的管理视角,需要多套网管系统之间切换使用。

3.网络扩展难

办公、零售场所随着业务的扩展,经常需要全国各地快速开店,目前网络的交付都是网络工程师通过console口登录一台台配置下发,效率低下且容易出错。

2.产品介绍

2.1网络管理范围

如下图定义网络管理的全生命周期,传统的网管系统,对网络的管理主要针对网络服役阶段,面向的是已上线网元的资源管理和运维监控等,无法做到网络设备的全生命周期管理。

图1 网络管理全生命周期

云网管对网络的管理是贯穿整个生命周期的,在网络未上线的时候,可以离线规划设计,定义网络架构;在建设交付的时候,将定义好的网络架构以项目的方式进行实施,整个交付过程流程可控,质量可管;验收通过后,网络正式进入服役阶段,在该阶段网络的核心诉求是稳定运行、少出故障以及故障发生后的快速定位和故障恢复,云网管的监控、变更、巡检等模块确保网络服役阶段的稳定运行直到网络下线。在整个网络生命周期中,资源管理确保网络资源与真实网络的一致性。

2.2 产品功能介绍

2.2.1 建设交付

  • 架构设计

在网络尚未上线时可以预先进行网络规划,网络架构用于定义网络组网的互联规范和技术规格,提供图形化的架构设计和管理功能,通过图形化的方式进行组网拓扑的灵活编排,并对各个网络组件的具体规格进行配置。
如图通过可视化的方式进行网络架构设计,定义网络模块的数量和连接关系。

图2 网络架构设计

结合设计好的网络规划和配置规范,自动生成可一键导入的标准配置文件。

图3 配置文件生成

  • 建设交付

建设交付是将网络方案以项目的形式进行设备下发,在每个项目中以工单的形式控制交付过程和保障质量。

图4 建设交付项目实施

2.2.2 智能运维

  • 态势感知

通过全局视角和分支视角对网络整体状态进行实时感知。
健康度: 结合设备告警情况、网络巡检状况、监控覆盖程度等多维度对网络状况进行评分。

动态拓扑: 通过LLDP和MAC扫描技术准实时拓扑更新,设备连接关系、端口信息等实时呈现。

  • 一体化监控

一个办公分支或者门店的网络,一般是涵盖了多个层次的网络,包含多种网络形态的设备。通常包括接入运营商的网关设备,进行数据转发的网络设备(路由器或交换机),提供WLAN的无线设备以及五花八门的终端应用。一套从网到端全链路覆盖的监控方案是必要的,因为往往端侧的异常,可能是有线网络的问题,有线侧的故障,会影响下游端侧多个终端或应用的使用。

云网管针对有线网络、无线网络、终端应用等不同网络层次的设备,通过主动采集、事件接收、插件部署、主动拨测等多种监控技术,从网关到终端全链路监控网络运行情况。在如下的监控视图里将交换机上联口流量、到运营商的出口流量、AP的终端连接数以及终端的监控信息等有线和无线的指标在一个视图里完成监控。

  • 网络编排

云网管提供可视化的流程编排引擎,用户通过拖拽的方式将网络操作的原子能力串联起来,保障业务下发时的事务完整和安全。

1.完整业务流程编排定义

2.单步配置流程可视化下发

  • 故障自愈

日常高频的故障场景,基于云网管的网络编排能力,可以将告警联动处理方案,快速实现故障止血和业务恢复。

3.架构介绍

3.1技术架构

  • 协议插件

云网管的协议插件集成了管理网络所需要的ssh、telnet、netconf、snmp、grpc等协议,支持管理市面常见的商用网络设备。
协议插件通过加密的安全通道与云端的采集控制实例进行通信,高效执行云端下发的设备操作指令和采集任务,并将数据压缩后实时反馈给云端进行分析和展示。
协议插件的Agent支持以云网管自有硬件、软件安装包、集成SDWAN网关等多种方式输出。

  • 采集控制

采集控制实例在云端部署,在云网管的整体架构中起承上启下的作用。
调度引擎的工作流程: 1. 接收网络编排下发的任务,按任务优先级、调度计划等策略,将任务进行合理拆解和调度。2. 根据设备厂家型号等维度将指令通过模板翻译映射为操作设备的具体指令。3. 将指令下发到Agent执行,等待接收执行结果 4. 任务执行结果分析和拼装
模板管理: 模板分为“用户模板”和“设备模板”两类,“用户模板”只具有业务含义,屏蔽了厂家差异,在网络编排中直接引用,“设备模板”是细化到厂商、型号粒度,不同的厂商之间都有明显差异。例如:“ACL策略”的设备模板,思科和华为是不同的指令。

  • 网络编排

网络编排负责业务模型的统一抽象和定义,网络编排将原子能力按业务流程进行串连,形成具体的网络方案。网络方案通过流程引擎驱动采集控制实例执行每一步的原子操作,以工单的方式控制事务完整和链路追踪。

  • 应用

网络编排以API的形式对应用提供能力和数据接口,应用层实现具体的“资源管理”、“网络巡检”、“网络变更”、“故障恢复”等能力,支持运维人员进行日常的网络运维、业务配置等工作。

3.2部署架构

云网管SaaS化部署,分钟级开通云上网管实例,用户侧只用部署探针(硬件版只需要上电和网络可达)即可。

云网管的计算和存储资源都是使用的阿里云资源,可以根据规格随时扩容,基于阿里云ASK集群实现的CI/CD功能,可以随时迭代上线新功能。

4.总结

云网管致力于为复杂、异构、分支众多的线下网络打造一款免部署、易上手、集中管理的SaaS化网络运维管理平台。

原文链接

本文为阿里云原创内容,未经允许不得转载。