公众号“EarthAi”
https://mp.weixin.qq.com/s/m-37sP7ADD1bpcWLcPTSDQ
GDOSphere:一种用于天气预报的球面图神经网络框架与神经算子 GDOSphere: A spherical graph neural network framework with neural operators for weather forecasting Zhewen Xu, Baoxiang Pan, Xiaohui Wei, Hongliang Li, Dongyuan Tian, Zijian Li
图 1 展示了 GDOSphere 的框架设计。我们采用正二十面体球(icosphere)结构来重建地球表面空间,并运用多阶微分算子来近似动态核,从而实现高效的时空相关性捕捉能力。
Xu, Zhewen, Baoxiang Pan, Xiaohui Wei, Hongliang Li, Dongyuan Tian, and Zijian Li. "GDOSphere: A spherical graph neural network framework with neural operators for weather forecasting." Physica A: Statistical Mechanics and its Applications (2025): 130772.
研究背景
天气预报一直以来都是人类社会密切关注的领域。传统的数值天气预报(NWP)基于求解偏微分方程等复杂计算方法,存在计算成本高、初始参数依赖性强、数据同化过程复杂等问题。随着大数据和深度学习的发展,数据驱动的天气预报(DDWP)成为一种新的途径,它避免了繁琐的数值计算,直接从海量数据中生成端到端的预报结果。
然而,目前基于二维平面网格的 DDWP 方法存在地理信息与球面空间不兼容的问题,导致空间聚合性差,且物理规则中的多阶微分分量需要巨大的参数空间来拟合,训练和推理效率低。此外,没有物理约束的 DDWP 在大参数空间中面临非收敛和低效的挑战,难以同时实现高保真度和高效的训练。
图2. 现有多项式方案在多尺度二十面体网格上的应用。我们设计了一种自适应多尺度网格组合算法,并将网格表面的值作为GNN的节点。
研究意义
在此背景下,本研究提出了一种名为 GDOSphere 的物理信息架构,旨在解决现有 DDWP 方法的不足。该架构利用多尺度球面空间上的定向微分,基于图微分算子(GDOs),将数据投影到统一的球面网格上,通过 GDOs 迭代聚合,然后再将数据重新映射回平面空间,并通过后处理补充时空细节,有望提高天气预报的准确性、训练效率和参数效率,为实际业务应用提供可能。
图 3 GDOs的处理流程
研究方法
• 图微分算子(GDOs) :GDOs 是 GDOSphere 的核心组件,包含嵌入值、多阶导数和交叉乘积,根据物理方程构建神经网络结构。它利用可学习的参数将可解析和不可解析的物理成分重新参数化,处理信号中的定向微分信息,提取基于物理规律的空间规律性。
例如,在处理大气运动的非线性偏微分方程时,GDOs 能够对空间输入进行一阶定向微分和拉普拉斯微分(二阶通用微分),以近似表达动力学和热力学中的动量平流分量和能量梯度分量等。通过这种方式,GDOs 能够捕捉大气状态变化中的时空数据变化规律,实现更高效、更符合物理实际的预报能力。
• 多尺度球面网格架构 :GDOSphere 生成多尺度二十面体球面网格,将不均匀的经纬网格数据映射到球面上。这种多尺度网格架构可以解决单尺度球面网格带来的空间信息不平衡问题,避免非收敛现象,同时能够实现不同分辨率下不同区域的自适应分辨率集成。
具体来说,通过迭代细分单位二十面体的每个面来形成多尺度球面网格,将不同细分阶数的球体的粗网格节点作为细网格节点的子集,将各级网格层次的边叠加到最细分辨率的网格上,生成多尺度网格集合。在粗网格上连接远距离区域,在细网格上捕捉局部相互作用,从而更好地适应不同尺度的大气现象和过程。
• 迭代聚合与后处理 :GDOSphere 采用迭代预测的方式,使用多个时间步长的天气状态来预测下一个时间步长的值。在迭代聚合过程中,通过 GDOs 块对不同分辨率的数据进行聚合,实现时空数据的有效整合和更新。
在数据后处理阶段,利用三维 U-Net 结构结合多头注意力机制,对从图重新映射回来的数据进行处理,增强因分辨率缩放而丢失的图像细节。通过计算均方误差(MSE)损失函数和图正则化损失函数,使用梯度下降法进行训练,优化模型参数,提高预报精度。
图 4 GDOSphere架构概览
实验数据
实验主要使用 WeatherBench2 数据集,该数据集从欧洲气象中心提供的 ERA5 再分析数据中提取,包含了 1983 年到 2023 年共 40 年的数据。其中,1983 年到 2013 年的数据用于训练,2014 年到 2018 年的数据用于测试,2019 年到 2023 年的数据也用于测试。数据的分辨率为 0.25°(1440×720×36 的经纬网格数据),涵盖了多个大气变量,如 500 百帕的位势高度(Z500)、700 百帕的湿度(Q700)、850 百帕的温度(T850)和 850 百帕的 U/V 风速。
图5. ACC和RMSE的预测技巧比较。
图6. 24小时预报的视觉比较。G.T.代表真实值(Ground Truth)
图7. ACU输出通道的敏感性分析 |