准确可靠的气象场是数值预报和气候研究的关键基础,但稀疏观测常导致偏差,限制了气象同化与历史数据重建的成效。为应对这一挑战,急需高效方法从有限观测中推估可靠的天气状态。
近期,中国科学院大气物理研究所肖子牛团队在《Journal of Geophysical Research: Machine Learning and Computation》上发表了题为“Learning to Infer Weather States Using Partial Observations”的研究论文,该论文第一作者为博士生晁杰,通讯作者为潘宝祥副研究员。论文提出CLIN(Climate Inpainting)方法,利用生成式模型从稀疏观测推估天气状态,为气象同化初始场生成和历史气候数据重建提供高效支持。
研究通过大量气象数据训练概率生成模型,学习大气环流的低维统计结构,构建气候态先验分布。在推理阶段,采用“Inpainting”技术,将稀疏观测融入生成过程,生成空间一致且具有不确定性量化的后验估计。此策略灵活适应不同观测布局,仅需约1%的网格观测即可生成高精度估计,大幅降低计算需求。
研究使用120个气象站数据,基于CLINERA5模型基于120个气象站数据生成100个集合成员,集合平均与ERA5基准高度接近,空间相关系数达0.980 ± 0.02,精确捕捉纬度梯度、地形效应和海陆差异。集合标准差显示,即使有观测约束,某些区域与ERA5的差异仍较大。集合之间的均方误差表明,CLIN生成集合时,部分区域具有较高的不确定性,观测数据难以完全约束整个场。标准差与均方误差的空间形态基本吻合,显示CLIN模型准确捕捉了不确定性分布,验证了模型不确定性量化的可靠性。
此外,CLIN模型通过增减观测站分析,量化观测点对估计误差的影响。在青藏高原等观测稀疏区域,新增观测站显著降低中部和东部区域的误差;而在珠江三角洲,移除观测站对误差影响较小,反映观测网络冗余。这些结果为优化观测布局提供依据。
CLIN模型展示了生成式模型在稀疏观测条件下推估天气状态估计精度的能力,为气象数据同化和历史气候数据重建提供了强有力支持。该研究得到了国家重点研发计划(2023YFC3007700和2023YFC3007705)等项目的资助。
论文信息:Chao J, Pan B*, Chen Q, et al. Learning to Infer Weather States Using Partial Observations[J]. Journal of Geophysical Research: Machine Learning and Computation, 2025, 2(1). https://doi.org/10.1029/2024jh000260图1. CLIN模型示意图
图2. CLIN模型生成结果与ERA5真值个例对比。第一行:ERA5(真值);第二行:CLINERA5模型集合平均;第三行:CLINERA5集合成员之间的方差;第四行:CLINERA5集合成员与ERA5之间的均方误差。
图3. CLIN模型增删观测站结果对比。第一列:原始观测误差结果;第二列:增加一个观测站后误差结果;第三列:删除一个观测站后误差结果;第四列:区域所在地形。
|