NOAA NCEP:发展一种混合机器学习与物理模型的全球集合预报系统 Development of a Hybrid ML and Physical Model Global Ensemble System Jun Wang, Sadegh Sadeghi Tabas, Bing Fu, Linlin Cui, Zhan Zhang, Lin Zhu, Jiayi Peng, Jacob R. Carley
研究背景
美国国家海洋和大气管理局(NOAA)下属的国家环境预测中心(NCEP)自20世纪90年代起就开始运行数值全球集合预报系统(GEFS)。然而,由于计算资源的限制,能够运行的集合成员数量有限。近年来,数据驱动的机器学习天气预报(MLWP)模型不仅在预报能力上优于传统的数值天气预报(NWP)模型,而且运行速度更快,计算资源消耗也显著减少。这为创建大规模集合预报系统提供了新的可能性。本文探讨了创建基于MLWP的全球集合预报系统的方法,包括将MLWP集合与现有的NWP全球集合系统相结合的混合集合系统。
研究意义
传统的数值天气预报模型在计算资源消耗和运行速度方面存在瓶颈,而机器学习模型的出现为解决这一问题提供了新的思路。通过将机器学习模型与传统物理模型相结合,不仅可以提高预报的准确性,还能显著降低计算成本,提高预报效率。此外,这种混合系统能够生成更大规模的集合预报,从而更好地估计不确定性,这对于天气预报的可靠性和实用性具有重要意义。
研究方法
本研究的核心是利用Google DeepMind开发的GraphCast模型构建MLWP全球集合预报系统(MLGEFS)。GraphCast是一种基于图神经网络(GNN)的模型,具有3670万参数,能够利用多分辨率网格表示地球表面,从而实现高分辨率的全球天气预报。研究团队对GraphCast进行了微调和重新训练,使用了NCEP的全球数据同化系统(GDAS)分析数据以及欧洲中期天气预报中心(ECMWF)的ERA5再分析数据和高分辨率预报(HRES)数据。
数据集与训练计划
研究使用了2021年3月20日至2023年1月的数据,分为训练集和验证集。训练数据覆盖2021年3月20日至2022年9月1日,验证数据覆盖2022年9月1日至2023年1月1日。为了验证模型预报的准确性,研究团队将模型预报与2023年的GDAS分析、ERA5再分析和GFS预报进行了比较。
GraphCast架构与训练过程
GraphCast模型基于图神经网络的编码-处理-解码配置。编码器将输入变量从经纬度网格映射到多分辨率网格表示,处理器利用16层GNN进行信息传递,解码器将学习到的特征从多分辨率网格表示转换回经纬度网格,生成输出。研究团队对GraphCast进行了微调和重新训练,使用GDAS分析数据作为输入,目标数据集包括GDAS分析、ERA5再分析和HRES分析数据。
研究结果
研究团队对MLGEFS、GEFSv12以及混合集合系统(SUPER62)进行了为期一个月的16天预报评估。结果表明,MLGEFS在北半球的短期预报中表现优于GEFSv12,在连续排名概率技巧评分(CRPSS)、集合均方根误差(RMSE)、布里尔技巧评分(Brier Skill Score)和接收者操作特征(ROC)面积评分等方面均有改善。混合集合系统SUPER62在所有区域和所有预报时效上均表现出显著的改进,尤其是在CRPSS和ROC面积评分方面,显示出更好的预测能力和更少的误报。
结论与不足
本研究成功开发了基于GraphCast的MLGEFS,并构建了包含62个集合成员的混合集合系统。MLGEFS在北半球的短期预报中表现出色,但在第二周的预报技巧提升相对较小,且集合离散度较低。混合集合系统在几乎所有预报时效和区域上均优于GEFSv12和MLGEFS,尤其是在热带气旋预报中,显示出更好的路径预报能力。然而,MLGEFS在飓风强度预报方面表现不佳,这可能是由于模型输出的平滑性导致的。
讨论与未来工作未来的研究将致力于解决MLGEFS的不足之处,包括增加集合离散度、改进长期预报技巧、引入新的MLWP模型以提高集合多样性,以及更新损失函数以保留物理特征。此外,研究团队计划扩大测试和评估范围,涵盖更多案例和季节,并考虑引入更大规模的混合MLWP/NWP集合系统。
以上是对文章的详细解读,如有不当之处欢迎批评指出!也可以私信小编(Earth_Ai)。
来源:“EarthAi”公众号
https://mp.weixin.qq.com/s/lBGgRsgGMJIdcjWu4xjyhA |