【论文解读】QTER : 面向Qos的低地轨道卫星网络三维高效可靠路由在论文中，创新点有三：一基于考虑不同用户需求，并计

在论文中，创新点有三：

一基于考虑不同用户需求，并计算成本，成为路由选择的参考；

二是渗流法，比洪泛法的成本更低，只选择附近的两个节点；

三是链路选择，先进行贪心算法，找到成本最小的，如果找不到进行回溯，回溯的过程选择链路可靠性最强的。

论文题目： QTER: QoS-Aware 3-D Efficient and Reliable Routing for LEO Satellite Networks

关键字：Low Earth Orbit (LEO) satellite networks, resource management, routing protocol

摘要：Low Earth Orbit (LEO) satellite networks offer a promising approach for achieving global coverage and highspeed Internet access. However, the existing communication frameworks within these networks may result in low robustness and reliability. This article introduces QTER, a novel and lightweight routing framework specifically designed for LEO networks, aimed at addressing these challenges. Our contributions are threefold. First, QTER establishes a cost-effective and reliable routing framework that accommodates a variety of applications with distinct Quality of Service (QoS) requirements. By enabling multipath routing, the framework minimizes costs while ensuring end-to-end reliability, thus enhancing adaptability to diverse service demands. Second, we leverage the unique structural characteristics of LEO satellite networks by modeling the satellite constellation as a 3-D network, wherein higher shell satellites serve as management satellite nodes (MSNs) to coordinate routing strategies among lower-shell satellites. This architecture significantly improves system efficiency and adaptability. Third, we propose a failure recovery mechanism that allows MSNs to relay packets when lower-orbit satellites are rendered unavailable due to environmental factors, thereby enhancing system robustness. Extensive simulations demonstrate that QTER exhibits resilience to node failures and dynamic network conditions, achieving reductions in average cost and delay by 59.4% and 38.9%, respectively, compared to baselines.

翻译：

低地球轨道(LEO)卫星网络为实现全球覆盖和高速互联网接入提供了一种有前景的方法。然而,这些网络中的现有通信框架可能导致鲁棒性和可靠性较低。本文介绍了 QTER, 这是一个专为 LEO 网络设计的新型轻量级路由框架,旨在解决这些挑战。我们的贡献有三方面。首先,QTER 建立了一个经济高效且可靠的路由框架,该框架能够适应具有不同服务质量 (QoS)需求的各种应用。通过支持多路径路由,该框架在确保端到端可靠性的同时最小化成本,从而增强了对多样化服务需求的适应性。其次,我们利用 LEO 卫星网络独特的结构特征,将卫星星座建模为三维网络,其中外层卫星作为管理卫星节点( MSNs)协调内层卫星之间的路由策略。这种架构显著提高了系统效率和适应性。第三,我们提出了一种故障恢复机制,允许 MSNs 在由于环境因素导致低轨道卫星不可用时中继数据包, 从而增强了系统鲁棒性。广泛的仿真表明,与基线相比, QTER 对节点故障和动态网络条件表现出弹性,平均成本和延迟分别降低了 59.4% 和 38.9%。

一、导论

（1）为什么要提出QTER？

弯曲管道通信框架，地面站接收数据后不会根据最优路径策略进行传输，导致网络延迟；自然灾害，网络拥塞
现有的最短路径和洪泛方法。最短路径某条链路断了通信就会断，洪泛成本高
受环境影响导致节点故障

（2）三大核心贡献

三维框架，该框架通过引入高轨卫星作为MSN来协调路由决策,为卫星通信提供更高的灵活性、成本效益和鲁棒，高轨卫星具有更广的覆盖范围，
轻量级的多路由算法，不是为每一个数据包选最佳的，而且是一组合适的路径，最小化总成本。渗透理论：量化选择多少条路径才能以多高的概率保证数据成功送达。而不是盲目地使用洪泛。
自适应的故障恢复制度。检测到有卫星或者链路坏了，MSN重新介入，重新路由数据流。
QTER 将平均成本和延迟降低了 59.4 % 和 38.9%。

二、相关工作

（1）背景讲解

低轨道卫星的优势是距离短，物理延迟低于中轨或同步轨道卫星，可以用于视频通话。其次全球覆盖，可以用于没有网络的海洋极地。但是高速运动，网络拓扑不断变化。
两种通信框架
1. 弯曲管道通信
  - 讲用户数据发到卫星，由最近的地面站转发，卫星只是第一条的中继。
  - 之后的数据传输完全依赖于地面光纤网络。卫星只负责“第一跳”。
  - 在无地面站区域有劣势
2. 星间通信
  - 卫星之间通过星间链路（ISL） ，通常是光学通信，直接进行数据传输。数据包可以在多颗卫星之间中继，形成一个“空中的互联网”。
  - 对卫星处理能力和算法有要求
  - QTER就是建立在星间链路之上的

图1：低地球轨道卫星网络中的弯曲管通信

图2：低地球轨道卫星网络中的星间通信

（2）研究空白的精准定位与QTER的动机

缺乏分层合作
环境因素
成本和可靠性的权衡

三、系统模型

（1）系统概述

V（节点集合） ：代表每一颗卫星。V = {1, 2, ..., V}。
E（边集合） ：代表星间链路。Li,j 表示卫星 i 和卫星 j 之间存在一条可以通信的链路。
链路类型：
- SL：同一轨道面内的链路。连接的是“前后”的邻居。
- OL：不同轨道面间的链路。连接的是“左右”的邻居。
1. 内层卫星是通信网络，用来传输数据，
2. 外层是MSN负责聚合信息并做出决策，当发生故障的时候要执行重路由
3. 实现控制面和数据面的分离
工作流程
- 用户发送请求
- 上报MSN
- MSN智能路由，并不适用所有的路由进行洪泛，智能选择一组低成本的链路
- 如果故障，重路由，有可能要充当中继数据包
- 数据交付
Qos的量化
- 表示0-1之间的值，表示传输可靠性
- 紧急通信可能0.99，数据换成可能0.95

（2）通信概述

下面是一系列的数学公式，可直接跳过，知道可以用这些公式求出可靠性就行：

图4：表示得到信道衰减

图5：表示得到信噪比

图6：表示得到比特错误率

图7：表示得到可靠性 - 后面要用到

（3）拓扑和路由策略

采用定向泛洪方法进行传输，只把数据包转发给距离目标目的地更近的卫星，最多两个。接收卫星收到第一个保存，第二个丢弃，如果很长时间没有收到相同的数据，也丢弃，说明已经在别的路径传输了。

拓扑建模
- 同一轨道具有相同角速度，所以相对静止。所以可以在短时间内看作是一个简化的矩形网格结构。
- 变成图论问题。
传统的不足
- 最短路径：寻找单一路径，中间节点坏了就会失效/中断
- 洪泛路由：资源浪费，成本大
QTER的核心
- 折中，允许多条路径但是控制路径的数量和方向，确保整体的方向是对的。
- 限制副本的数量，控制成本的关键
- 创建路径冗余，源到目的只会形成一个路径束。
重复数据包的处理
- 缓存首次的数据包
- 后续的重复数据包丢掉
- 引入一个超时机制，长时间未收到新数据则清理缓存。
  - 收到数据之后会立即转发，然后在缓存里面记录id，并启动定时器。在定时器超时之前，收到了重复的数据包，就丢弃。超时后，没有收到重复的数据包，认为这个数据包的生命周期已经结束了，要么成功送到了，要么丢了。
  - 接收 -> 查缓存 -> [若为新包] -> 立即转发 + 存入缓存并启动定时器 -> [若为重复包] -> 立即丢弃

四、问题公式化及解决方案

（1）管理层可靠性计算

如何由MSN来量化计算一条“路径束”的端到端可靠性，从而为后续的成本优化提供依据。

1）核心概念：按跳数分组，比如源卫星所在组为G0只需要0跳，G1为所有从源卫星一跳就能到达的卫星组成的集合。

Si属于V，根据跳数被分成不同的组，表示组Gi中的卫星集合。V是卫星集合，
Li属于S，表示用于向Gi+1传输数据包的链路
|Li|=m,表示有2^m-1种链路组合。
Si’属于Si表示已经从Gi-1收集到数据包的卫星集合
Li’表示已经从Gi-1收集到数据包的链路集合

例如：绿色表示选中的路

G = {G0,G1,G2,G3,G4,G5,G6}
S2 = {DEF},S2′ = {E,F}
L2 ={LE,H,LE,I,LF,I,LF, J} 和 L′ 2 = {LE,H, LE,I, LF,I}
假设ai是MSN在组Gi中选择的动作，可用动作是“2^|Li| − 1
对于组G2来说，已经被选择传输数据包的有E和F，所以从G2到G3有四条链路可以选择，从图中可以看出被选择的链路是EH，EI，FI，我们用二元变量设置表示为1110，结果为14，也就是说a2等于14.

状态、动作与马尔可夫决策过程

状态： 每个组 Gi 就是一个状态。状态空间 S = {G0, G1, ..., GT}。数据包当前在哪个组，就处于哪个状态。
动作： 在每个状态（组）Gi，MSN需要做出的决策是：从当前组 Gi 到下一组 Gi+1，要使用哪些链路？这个链路组合的选择，就是一个动作 ai。
动作空间：如果组 Gi 有 m 条可用链路 (|Li| = m)，那么可能的非空链路组合有 2^m - 1 种 （每一条链路都有选择和不选择两种情况） 。所以动作空间 Ai = {1, 2, ..., 2^m - 1}。每个数字代表一种独特的二进制链路选择方案
状态转移概率： 当在状态 Gi-1 选择了动作 ai-1（即使用了一组特定的链路）后，数据包成功到达状态 Gi 的概率是多少？这个概率就是 Pr(Gi | ai-1)，即状态转移概率。

（2）可靠性计算

下图：可靠性计算的递归公式

在 Gi-1 组选择动作 ai-1 的前提下，数据包能到达 Gi 组的概率为：

Pr(Gi-1 | ai-2)：数据包通过ai-2到达Gi-1的概率
Gi | (ai-1 | Gi-1, ai-2)：数据包已经在Gi-1的情况下，且是由动作ai-2到达Gi-1的情况下，选择ai-1且成功到达Gi的概率

下图：例子：计算G0到G3的可靠性。

对所有在G2组可能采取的动作a2进行求和
比如当a2等于14：
- 取决于数据是如何到达G2的，由G1决定
- 只有当a1=3，即11，即EF才可以都收到数据，选择a2=14才有意义
- Pr(G3 | 14) = Pr(G2 | 3) × [G3 | (14 | G2, 3)]

（3）问题公式化：

链路建立开销定义：

D(Li,j)/ξ 表示传播延迟，D(Li,j)是两个卫星之间的距离，ξ是传播速度，κi,j是激光校准时间

等待成本定义：W（Li，j）

总链路成本：v1C_tr(Li,j)+v2W（Li，j）；v1和v2是可调节系数

五、算法设计与解决方案

（1）基于学习的等待延迟预测框架，集成CNN、注意力机制、全连接网络

本文所采用的预测等待时延的方法是基于机器学习的方法，其模型结构如下图所示。其中CNN能够有效地捕捉等待时延与时间的短期关系，使得能够根据延迟波动的当前模式和周期趋势进行等待时延预测，但又由于CNN无法很好捕捉长序列的依赖关系，所以在CNN的基础上引入了多头注意力机制，补足发现较长时间间隔和全局趋势的相关性的能力，最后再通过一个全连接层输出预测结果。

本文将地球分为了多个地区，每个地区都由（西经，东经，南纬，北纬）四个参数组成。而且在每个地区都把时间进行离散化成多个时间序列以及假设平均等待延迟ϵ_k(t)，代表着区域k在时间t时的平均等待延迟。若想预测区域k在时间t的平均等待时延，则将区域k中时间t的前u个时间步长的平均等待时延序列作为等待时延框架的输入。

模型的训练会在地面站（GS）完成，它会在MSN即将服务这个地区前将这个地区的时延预测模型上传给MSN。这样能够利用地面充足的计算资源进行训练。

（2）容错机制

QTER能够大量减少网络中数据包的数量不仅仅是因为使用了渗流法，还有QTER通过MSNs对路由选择进行决策，故实际上部分可选的链路并不会被选择，使得网络中数据包会进一步减少。例如右图中从Group1到Group2可以通过BD、BE、CE、CF四条链路，但MSN只选择了CE、CF两条链路。

若从当前组中转发数据到下一组中不可用的低轨卫星节点，则会路由数据到MSN，让MSN代替该节点进行后续路由。如图，在E卫星不可用时，MSN路由选择动作又为0011时，则C会将数据包转发到m1，让m1替代E卫星进行后续的转发操作。

（3）链路决策算法

本文的链路决策算法是一种贪心+回溯的策略。首先先介绍这篇文章的贪心策略是怎么做的，再介绍如何把回溯融入到贪心中。

贪心策略：如果MSN能够在一个状态下找到一个开销最小的并且能够满足QoS要求的动作，则直接选择这个动作。

贪心+回溯策略：如果MSN无法在状态i下找到一个能够满足QoS要求的动作，则回溯到状态i-1后直接选择可靠性最强的动作进入状态i，并尝试使用贪心策略进入状态i+1，若仍无法找到一个能够满足QoS要求的动作，就再回退到状态i-2后再直接选择可靠性最强的动作进入状态i-1，以此类推。若到达状态0且状态0下可靠性最强的动作也已经被尝试过，则说明当前系统中找不到一条能够满足所需QoS的链路。

【论文解读】QTER : 面向Qos的低地轨道卫星网络三维高效可靠路由