AI应用激增导致带宽需求和网络复杂性增加。通信服务提供商需利用自动化、开放标准及AI技术,提升光网络动态性和效率,实现智能自优网络,加速服务交付并降低运营成本。
译自:Why AI Traffic Growth Demands Optical Network Automation Now
作者:Pino Dicorato
随着AI、高清视频流、云和5G移动应用的日益普及,对带宽的需求持续激增。为应对这一趋势,光服务需要变得更加动态,并满足更严格的服务级别要求。因此,通信服务提供商(CSP)拥有的用于移动传输、企业服务或宽带接入服务的城域网络面临着电力、多业务聚合、安全性、AI集成和网络切片等新需求。图1展示了典型城域网中丰富多样的应用。
图1 — 典型城域网支持丰富多样的应用。
随着AI使用的增长,它将产生一种倍增效应,驱动大量流量涌向传输网络。但AI工作负载对吞吐量、延迟和可靠性提出的严峻要求,已将网络规模和复杂性提升到了一个新的水平。通信服务提供商正面临前所未有的压力,需要提供更多、更快、更好的服务。
图2显示了基于诺基亚贝尔实验室近期研究的AI流量增长影响。这种增长范围可能在14%到31%之间。
图2 — 流量增长对通信服务提供商网络的影响。通信服务提供商的接入和聚合网络(橙色)将承受最重的负载,约占AI总流量的31%。通信服务提供商的城域网(粉色)次之,占28%,区域网络(蓝色)约占14%。
尽管面临这种增长,通信服务提供商仍需加快服务开通速度并缩短平均修复时间,以降低运营支出(OPEX)并最大限度地提高基础设施投资回报。
用于配置和监控基本静态光网络的手动流程无法提供AI所需的动态连接能力。AI就绪的光网络需要快速、高效的服务交付和灵活性,以提供满足特定要求(如低延迟或高弹性)的服务。网络巨头已经通过网络自动化解决了这些需求,为更广泛的行业铺平了道路。
机会显而易见:自动化可以减少错误、简化操作、加快响应时间并释放新的效率。通信服务提供商可以通过将自动化与使传输网络更具可配置性的成熟使能技术相结合,来简化操作、提升网络性能并开启新的变现机会,这些技术包括:
- 可重构光分插复用器(ROADMs)
- 提供多种线路速率模式的相干可插拔模块
- 时间与频率同步
- 支持线路速率的加密技术。
自动化日益普及
2024年Heavy Reading调查突出了网络自动化日益增长的重要性。不断增长的网络复杂性和规模推动了对高级自动化的需求,这种自动化能够抽象底层基础设施细节并简化网络操作。少数受访的通信服务提供商仍以完全手动的方式运营。大多数公司将他们的网络自动化水平描述为从“辅助管理”到“部分自动化”不等,系统利用实时数据和高级分析提供有意义的建议。许多公司计划在未来三年内向高度自治的网络迈进。
开放行业模型
多年来,网络自动化一直受到碎片化管理系统、专有接口和工作流以及对网络性能有限可见性的阻碍。如今,随着支持通信网络中知名行业论坛标准化的自动化框架的出现,这些障碍正在降低。
多个行业论坛致力于推动传输网络的标准化,包括OpenConfig、OpenROADM、互联网工程任务组(IETF)、Linux基金会、TMForum、光互联论坛(OIF)和创新光无线网络(IOWN)全球论坛。这些论坛致力于开发架构和软件抽象的接口层,以促进多供应商生态系统。
这项工作有助于解决通信服务提供商的一个常见问题:他们的现有部署通常包含其网络所有网段中来自多个供应商的设备。这些设备资产旨在网络中长期运行,因此通信服务提供商利用不同供应商的技术优势来实现其业务目标。因此,他们需要有令人信服的理由来更换设备,这意味着他们很少依赖单一供应商。
行业论坛提供数据建模语言或抽象的开放API协议,通过网络配置(NETCONF)或表征状态传输配置(RESTCONF)直接与网络域层通信。这些标准的模块化确保了可重用性,因此自动化可以随着新用例的出现而扩展。该模型保证状态变化和配置数据可以从网络读取并写入网络,使开发人员能够跨承载服务的资源创建富有洞察力的功能逻辑。典型的建模堆栈(图3)通过允许开发人员使用他们偏好的编程语言来促进包容性。
图3 — 开发者网络自动化框架
这些标准现在已准备好进行自动化,因为它们支持操作、管理、维护、配置和报告,以及光子损伤建模等多供应商设备规划、复杂拓扑的精细网络层模型以及新兴的IP over DWDM(IPoDWDM)范式等高级功能。
标准的最新更新包括改进的告警和性能KPI监控、流式遥测、详细的物理路由信息和弹性路由约束,从而支持基于保护的服务请求,所有这些都可用于提供高端的可变现服务。总的来说,这些发展提升了用户体验,同时满足了多供应商生态系统中应用程序日益增长的容量需求。
OIF等标准验证了多供应商相干技术、路由器和网络元素在多跨度网络中的互操作性。它们最大限度地减少了对规范的依赖,这些规范确保自动化用例无需额外测试来验证特定供应商技术即可实现其业务成果。
同时,先进的网络控制器采用围绕标准数据模型和开放API设计的模块化软件架构。这些架构促进了网络南向和多样化自动化环境北向的无缝通信。团队现在可以利用来自网络设备的实时性能指标,而不再依赖静态网络快照和有限的测量。如果数据洪流变得难以承受,AI/ML技术可以帮助他们分析海量数据集,检测异常并预测行为。
网络领域中的许多用例都可以实现自动化。通信服务提供商应采取增量方法,从简单的用例开始,解决日常物流问题,例如传输网络中的库存和服务管理。这对通信服务提供商来说是一个典型的痛点,因为它会影响维护、供应链和网络设计,因为他们需要增加网络容量或将网络扩展到新的地理区域。
接下来,通信服务提供商可以处理中间操作用例,例如网络内的连接调试、配置和供应。对许多人来说,由于端点位置之间的设备交付过程以及为特定服务等级协议(SLA)供应服务所涉及的协调和行动,面向最终用户的服务上市时间通常很慢。
最后,通信服务提供商可以解决需要更高自动化的更复杂场景,例如构建闭环操作以根据所需的覆盖范围要求和跨域(IP/光)操作优化连接和光链路,或增强故障排除和根本原因检测。然后,这些基于闭环的工作流可以扩展到支持AI的预测性自动化,以支持需求预测或软故障检测等用例,或侧重于网络弹性的假设分析。
自动化工具
对于网络自动化,开发人员在开始创建涉及通过网络元素、网络控制器或管理系统与传输域进行程序化交互的用例之前,需要正确的工具。这些工具可能包括:
- 工作流管理工具,例如OpenStack Mistral,用于将手动任务转化为自动化工作流。这些工具有助于根据手动、计划或事件触发器控制任务执行。它们还监控任务、跟踪正在运行的工作流的进度并记录错误。
- Swagger或Visual Studio Code编辑器,使开发人员能够编码并访问扩展,例如安全外壳(SSH)以支持远程连接、访问托管特定产品开放API的远程服务器或创建自己的API功能集。Swagger开发人员门户也可用作测试和验证特定供应商API使用。图4显示了一系列对Linux Foundation T-API库的“GET”API调用示例。
图4 — 使用Swagger的OpenAPI示例。
- Python工具,让开发人员可以使用现代编程语言为工作流任务创建脚本或代码。
- GitHub,一个基于网络的公共或私有仓库,可以存储开发代码。GitHub平台支持代码的轻松共享、编辑和版本控制,使团队能够持续更新和纠正API代码。
- 光数字孪生,一个现有光通信网络的虚拟实时副本,包括终端设备、光线路系统元件和光纤损耗特性。通信服务提供商可以使用数字孪生安全地探索配置、调试、保护、恢复和优化场景,并根据真实网络条件执行假设分析以识别操作风险。更重要的是,他们可以在不中断已部署网络上的现有操作的情况下测试和验证API。光传输网络数字孪生尚未完全解耦,因此它们无法在同一系统中支持不同供应商的网络元素。然而,它们托管在虚拟机上的云端,这允许开发人员构建工作流逻辑来支持网络控制器之间的通信,从而实现多网络管理。
当通信服务提供商或开发人员使用这些工具创建自动化工作流时,他们必须确保这些工具提供所需的功能,以将这些工作流从简单用例扩展到更复杂的用例。
构建自动化工作流的指导
自动化工具和开放标准API提供的灵活性使通信服务提供商能够将自动化用于以下用例:
- 快速增加新容量,从数周或数月缩短到数分钟。
- 定位故障并诊断和排除常见问题,以缩短平均修复时间。
- 根据策略驱动的规则优化网络中特定链路的性能。
- 编制有关网络库存资源消耗的定制报告,以支持更好的网络规划决策。
对于开发人员和通信服务提供商来说,开始自动化之旅的一种实用方法是构建工作流,这些工作流定义了针对目标用例所需的一系列顺序任务和条件分支,然后使用工作流工具监控其执行流程。或者,供应商提供咨询服务,提供代码片段以帮助开发团队开始自动化,使他们能够快速上手。
图5展示了一个概念性网络库存报告工作流,它可能是一个更大工作流的一部分。
图5 — 网络库存检索工作流。
AI驱动的网络自动化
AI的使用进一步拓展了网络自动化的潜力,推动更智能、更具适应性的网络运营。
生成式AI驱动的对话助手正在成为运维团队宝贵且易于适应的工具。它们可以响应自然语言查询,指导故障排除,搜索相关文档并建议配置更改,使复杂任务更易于执行并缩短解决时间。
通过AI驱动的自动化,开发人员可以排除网络问题,验证网络中直接采取的行动,并快速评估操作状态。这改善了用户体验并加速了交付时间。
转向自主网络自动化
TMForum是一个标准联盟,汇集了网络设备供应商、通信服务提供商和超大规模公司。它提供了蓝图和方法,使通信服务提供商能够使用标准化的开放API来构建模块化、支持AI的解决方案。随着通信服务提供商努力使其网络更加自主,TMForum通过支持自愈和自优化的架构来帮助他们,从而无需人工干预。
这些标准正在促使网络设备供应商通过闭环自动化增强其平台,其中包括由AI/ML驱动的反应式触发器和预测式触发器。闭环操作是完全自主网络的先决条件。不断演进的架构在网络管理平台中引入了代理框架,这些框架通过gNMI或Kafka接口流式传输KPI数据,整合趋势分析和智能,并在SLA受到影响之前主动保护服务。
这个新框架使开发人员能够利用来自网络域自动化层的集成闭环功能,创建意图驱动的工作流用例。这意味着他们可以专注于设计或定制自动化现有流程的工作流,并直接连接到北向运营和业务支持系统(OSS/BSS)。
是时候自动化了!
AI正在改变网络并重塑电信网络域层,使开发人员更容易降低运营复杂性并提高效率。为了利用AI,许多开发人员正在转向自动化工具和开放API,这些工具和API现在更加成熟且所有人都可以访问。
好消息是,有许多工具可以轻松使用AI。通过数字孪生,开发人员可以模拟特定业务用例,验证它们,并在将其部署到实时网络之前了解其影响。这些结果将带来新的用例,从而节省成本并改进现有运营流程。
通过循序渐进地开始,使用基于标准的接口和内部化的闭环操作,通信服务提供商和开发人员可以随着时间的推移扩展自动化,而不会中断现有操作。这种方法使他们能够更协作、更高效地工作,更有效地响应运营需求,并迅速从网络中开启新的潜在变现机会,所有这些都将增强他们的竞争优势。




