编辑 | 萝卜皮
辐射传输模拟和遥感研究从根本上需要对非球形粒子的光学特性进行准确有效的计算。浙江大学的研究人员提出了一种结合光学特性数据库的深度学习(DL)方案来解决这一问题。
深度神经网络(DNN)架构是从具有大量形状参数、尺寸参数和折射率的超球体的光学特性数据集中获得的。数据集是通过不变嵌入 T 矩阵方法计算的。创建了四个独立的 DNN 架构来计算消光效率因子、单散射反照率、不对称因子和相位矩阵。
设计这些神经网络的标准是用最少的 DNN 参数实现最高的预测精度。数值结果表明,神经网络的预测值与数据库的真值之间的决定系数大于0.999,这表明DNN可以高精度地再现数据集中的光学特性。
此外,DNN 模型可以对数据库中不可用的形状参数或折射率进行高精度的粒子光学特性预测。重要的是,数据库大小的比率(∼127 GB)至DNN参数(∼20 MB)约为6810,这意味着 DNN 模型可以被视为一个高度压缩的数据库,可以作为原始数据库的替代品,用于实时计算辐射传输和大气模型中非球形粒子的光学特性。
该研究以「Application of a Neural Network to Store and Compute the Optical Properties of Non-Spherical Particles」为题,于 2022 年 2 月 5 日发布在《Advances in Atmospheric Sciences》。
悬浮在大气中的气溶胶颗粒是地气系统的重要组成部分。这些粒子在大气物理和辐射过程中发挥着重要作用。根据中国浙江大学毕磊研究员的说法,准确有效地模拟粒子(主要是非球形)的光散射是一个基本问题。
「过去,为了提高电磁散射计算的效率,采用传统的查找表(LUT)方法……」中国气象局(CMA)的韩威博士说,「……但是随着粒子参数的增加,LUT的体积会变大,这对于进一步的应用是相当不方便的。」
通过设计一个最优的神经网络架构,研究人员成功地将大气粒子的光学特性压缩在一个超球体形状空间中。这个过程被称为创建深度神经网络或 DNN,它可以高精度地将大量数据压缩成可管理的文件大小。
图示:超椭球粒子光学特性数据库示意图。(来源:论文)
该团队的方法,通过使用超球体形状模型来替代直接使用光学特性数据库。通过不断改变 DNN 的架构,我们确定了几个优化模型,它们的参数很少,但同时实现了高精度。选定的 DNN 在从测试数据集中随机选择的 100,000 个足够大的数据集中展示了相对快速地学习光学特性的能力,确定系数 > 0.999。
合作者俞金禾表示:「使用 DNN 模型参数,文件大小仅为 20MB,比原始数据库(127GB)小近 7000 倍,计算结果与真值之间的决定系数可高达 0.999。」
此准确度评级允许用户更轻松地存储数据库而不会丢失重要数据。更好的存储技术,例如 DNN,可以使数据库应用程序更加便携,并适用于当前和未来的建模工作。有了这些信息,研究人员检查了未知大气颗粒大小和形状的 DNN 性能,发现预测结果具有足够的准确性。
图示:几个已建立的 DNN 模型的 RMSE(橙色点)和决定系数(绿色点)的散点图。(来源:论文)
该数据库被压缩了 6810 倍,并获得了出色的精度,展示了获得准确和实时光学特性计算的潜力。真正令人印象深刻的是能够在散射角变化时捕获相位矩阵的大振荡。即使数据库中没有粒子参数,DNN 也足够强大,可以以合理的精度获得粒子的光学特性。因此,DL 方案可以再现原始数据库并预测形状和折射率参数未知的光学特性。
由于其存储空间小和便携性,DNN 模型可以很容易地应用于大气辐射传输、遥感反演算法或全球气候模拟。但需要注意的是,DNN 模型不是物理光散射模型,而是一种参数化粒子光学特性的便捷方法。由于不规则的非球形颗粒可以合理地近似为超球形,因此该研究开发的 DNN 模型有望在气溶胶光学建模中非常有用。
图示:DNN 预测的 g 的绝对误差和数据库中的真实值。(来源:论文)
「我们的发现对实际应用很重要。」中国工程院院士张小曳补充道,「高效准确地计算非球形粒子的光学特性对于化学数据同化和化学天气预报研究至关重要。」
为了进一步实现他们的研究目标,该团队计划将 DL 方案和 DNN 模型应用于全球/区域同化和预测增强系统(GRAPES)和中国统一大气化学环境(CUACE)系统,以开发这一开创性算法的更多应用。