转自:“EarthAi”公众号 https://mp.weixin.qq.com/s/3GN4xpaD9zCJbB0LTc2wLw
CAM-NET:一种用于全大气层(包括热层和电离层扩展)的人工智能模型 CAM-NET: An AI Model for Whole Atmosphere with Thermosphere and Ionosphere Extension Jiahui Hu, Wenjun Dong
研究背景
大气建模和预测一直是大气科学领域的研究重点。传统的基于物理的数值天气预报(NWP)模型通过数值求解描述大气、陆地和海洋系统之间复杂物理相互作用的微分方程来预测未来的天气条件。然而,这些模型通常生成的确定性输出仅依赖于初始条件,并未明确纳入天气系统演变中固有的不确定性。此外,大气过程的物理基础由高度非线性和高维的偏微分方程控制,准确求解这些方程需要巨大的计算资源和精确的初始化。这些因素不仅限制了长期天气预报的准确性,也阻碍了实时应用的可行性,这些应用既需要速度又需要可靠性。
近年来,随着深度学习技术的发展,数据驱动模型逐渐成为提升NWP模型预测能力的重要手段。例如,FourCastNet、GraphCast、Pangu-Weather等模型在中短期天气预报中展现出与传统数值模型相当甚至更高的预测精度,同时显著降低了计算成本和推理时间。然而,这些模型大多专注于从地表到平流层的预测,而对于从地表到热层的全大气层建模则相对欠缺。全大气层模型对于理解重力波的向上传播及其对高层大气动力学和大气层间耦合的影响至关重要。
研究意义
本研究提出了一个名为CAM-NET的人工智能模型,旨在以高精度和计算效率预测从地球表面到电离层的中性大气变量。该模型利用球面傅里叶神经算子(SFNO)来捕捉全球尺度的大气动力学,同时保留地球的球形结构。与传统的数值模型相比,CAM-NET在推理时间上实现了超过1000倍的速度提升,能够在几分钟内提供一年的模拟结果。此外,CAM-NET通过模块化架构将示踪剂预测与核心动力学明确分离,使得模型能够高效地适应特定的示踪剂场景,而无需重新训练整个模型。这一创新为全大气层建模提供了一种灵活且成本效益高的解决方案,对于理解大气层间耦合和重力波传播等关键科学问题具有重要意义。
方法
数据来源与预处理
CAM-NET的训练数据来源于全大气社区气候模型(WACCM-X),该模型由美国国家大气研究中心(NCAR)开发,能够模拟从地球表面到电离层的动力学过程。WACCM-X的数据集包括每3小时一次的中性大气和电离层变量,空间分辨率为0.9°×1.25°(纬度×经度),并根据混合sigma压力坐标定义不同的高度层。研究中使用了2001-2011年的数据进行训练,2012-2013年的数据用于测试,而2014年的数据用于模型推理。
CAM-NET架构
CAM-NET的核心架构基于SFNO,这是一种专门针对地球球形几何结构设计的神经算子。与传统的傅里叶神经算子(FNO)不同,SFNO使用球谐变换(SHT)代替离散傅里叶变换(DFT),以保留地球的球形几何结构。CAM-NET的架构包括三个主要部分:输入编码器、基于SFNO的频谱卷积层和解码器。输入编码器将原始大气变量投影到潜在空间,并加入位置嵌入以保留空间结构。频谱卷积层在频域中操作,通过点乘应用学习到的复值滤波器。解码器则将频谱信号转换回物理空间,重建预测结果。
为了提高长期预测的准确性,CAM-NET采用了多步训练阶段。在初始训练阶段之后,模型切换到多步预测阶段,此时损失函数在连续的时间步长上计算,允许模型最小化跨时间步长的累积误差。此外,CAM-NET还引入了一个轻量级的微调模块,用于预测示踪剂变量,如氧气(O2)浓度。这一模块与核心动力学模块分离,使得模型能够高效地适应特定的示踪剂场景,而无需重新训练整个模型。
研究结果
基础物理变量的预测
通过与WACCM-X模型的比较,CAM-NET在多个空间和时间尺度上展现了其预测能力。在三个代表性高度(20公里、90公里和250公里)上,CAM-NET对经向风、纬向风、垂直气压变化率和温度的预测与WACCM-X的目标值具有良好的一致性。特别是在20公里和250公里的高度,CAM-NET能够准确捕捉大尺度结构。然而,在90公里高度的中层大气中,模型对小尺度特征的预测存在一定的不足。这一现象可能与中层大气中重力波的破碎和湍流产生有关,这些过程的时空尺度较细,难以被CAM-NET有效解析或学习。
示踪剂变量的预测
CAM-NET在预测O2浓度方面也展现出了良好的性能。在90公里高度的O2浓度预测中,CAM-NET能够很好地捕捉大尺度空间模式,包括纬度梯度和昼夜不对称性。尽管随着时间的推移,误差在具有强烈空间变化的区域(如高纬度和子午面)有所增加,但模型在长时间预报中仍保持了物理一致性。这表明CAM-NET在模拟示踪剂动力学方面具有较高的准确性和长期稳定性。
结论与不足
CAM-NET作为一种新型的全大气层人工智能模型,在预测基础物理变量和示踪剂变量方面展现出了与传统数值模型相当的准确性,同时在推理时间上实现了显著的加速。其模块化架构使得模型能够灵活地适应不同的示踪剂场景,而无需重新训练整个模型。然而,CAM-NET在中层大气(约90公里高度)的小尺度特征预测上存在一定的局限性,这主要是由于模型对高频模式的敏感性不足,导致对重力波破碎和湍流产生的小尺度结构预测不够准确。
讨论
尽管CAM-NET在全大气层建模方面取得了显著进展,但仍存在一些改进空间。例如,可以探索新的神经算子设计,如频率放大技术和混合空间-频谱架构,以减轻模型的频谱偏差,并在高频区域恢复保真度。此外,将物理信息约束(如守恒定律)嵌入训练过程,也可能有助于增强模型的物理一致性和频谱完整性。另一种可能的途径是整合生成性扩散模型,通过迭代去噪和上采样来恢复细尺度结构,从而在不牺牲大尺度连贯性的情况下重建湍流等特征。
未来工作
未来的研究将致力于进一步优化CAM-NET的架构和训练策略,以提高模型在中层大气小尺度特征预测上的准确性。此外,研究团队计划将CAM-NET应用于更多的示踪剂模拟任务,并探索其在区域气候建模和观测数据同化中的应用潜力。通过这些工作,CAM-NET有望为全大气层建模提供一种更加高效、准确且灵活的解决方案,为大气科学研究和实际应用开辟新的途径。
以上是对文章的详细解读,如有不当之处欢迎批评指出!也可以私信小编(Earth_Ai)。
(图略,详见 https://arxiv.org/pdf/2506.19340) |