返回列表 发布新帖
查看: 20|回复: 0

深度学习技术在降水临近预报领域取得突破!

253

主题

33

回帖

980

积分

高级会员

积分
980
发表于 2025-6-3 10:41:20 | 查看全部 |阅读模式
面向降水临近预报的时空融合方法研究
Towards a Spatiotemporal Fusion Approach to
Precipitation Nowcasting

一、研究背景
降水临近预报(Precipitation nowcasting)是指在六小时内的降水预测。这项任务极具挑战性,因为它需要整合来自多种数据源的高分辨率时空观测数据,包括雷达、卫星、闪电探测网络、地面观测站、风廓线仪和探空仪等。这些数据来源广泛且复杂,如何将它们有效整合到一个统一的、网格化的降水临近预报模型中,是当前气象学研究中的一个重要课题。

近年来,随着气象数据的不断增加,数值模式和再分析产品的可用性提高,数据融合技术的重要性日益凸显。数据融合能够将多个记录同一对象的数据源融合成一个单一的、一致的、更完整的表示。这对于提高天气预报的准确性和可靠性至关重要。尤其是在热带地区,对流性降水占主导地位,传统的预报方法往往难以准确捕捉这种快速变化的降水过程。而深度学习技术的发展为解决这一问题提供了新的思路。

二、研究意义
本研究的意义在于提出了一种新的时空融合方法,用于降水临近预报。这种方法通过整合里约热内卢大都市区的气象站和雨量计站数据、ERA5再分析数据以及全球预报系统(GFS)数值天气预报数据,利用深度学习架构STConvS2S进行建模。这种方法不仅能够提高降水预报的准确性,还特别关注极端降水事件的预测,这对于减轻自然灾害(如洪水、山体滑坡和干旱)的影响以及支持农业、交通、能源和公共卫生等领域的决策具有重要意义。

三、研究方法
(一)时空融合方法概述
本研究提出的方法是在训练阶段将多个雨量计站与ERA5再分析数据进行整合,在推理阶段将实时地面站数据与GFS数值天气预报模型的模拟数据进行整合。这种方法能够构建出没有缺失数据的均匀和规则网格。由于ERA5再分析数据存在五天的延迟,因此在推理阶段使用GFS模型,该模型每6小时提供一次基于初始条件的预测,并且与ERA5的0.25度空间分辨率兼容。

(二)数据集构建
数据集构建过程是将多个站点的降水数据整合到一个网格结构中。每个网格单元包含19个变量的值,包括地面降水测量值和三个大气标准压力层(200、700和1000 hPa)的6个气象变量。对于每个网格单元,如果单元内至少有一个雨量计站,则取该单元内所有站点记录的降水测量值中的最大值作为目标值;如果没有雨量计站,则使用该单元四个ERA5网格点的最大降水值作为目标值。这种方法通过选择最大值来强调极端降水事件在数据分布中的重要性。

(三)模型构建与评估
本研究使用STConvS2S深度学习架构来训练降水临近预报模型。该架构通过仅使用卷积层来捕获空间和时间数据依赖关系。数据集按照时间顺序分为训练集(60%)、验证集(20%)和测试集(20%)。模型误差使用加权平均绝对误差(MAE)损失计算,特别强调罕见降水水平。此外,还使用混淆矩阵、平均偏差和F1分数来评估模型在不同降水强度水平(弱、中、强和极端)上的性能。

四、数据
本研究使用了2011年1月1日至2024年10月31日的历史数据,总共120529个时间步(小时),即120529个网格。研究区域为里约热内卢大都市区,该区域有83个Sirenes系统的雨量计、33个AlertaRio系统的雨量计和19个INMET(国家气象研究所)的气象站。研究中还考虑了ERA5再分析数据和GFS数值天气预报数据,这些数据的空间分辨率为0.25度。

五、研究结果
(一)数据融合效果
通过数据融合,研究区域内的降水数据表现出一致性和均匀性。在2024年1月13日的降水热图中,可以看到里约热内卢地区出现了极端降水,降水值超过50 mm/h。此外,通过对比Sirenes系统的“Pavão-Pavãozinho 2”站和ERA5再分析模型在2022年1月至2022年6月期间的降水测量值,发现两者降水数据的稀疏性模式相似,但Sirenes站的降水测量值始终大于ERA5模型的对应值。

(二)模型性能
在不同降水强度水平上,模型的性能表现如下:

  • MAE误差:对于极端降水水平,ERA5+SIA模型的MAE误差为41.8832 mm/h,而对于多数类“弱”水平,误差接近0 mm/h。
  • 偏差:模型的偏差在“极端”类别中主要为负值,表明模型倾向于低估降水水平。
  • 混淆矩阵:以1小时提前时间为例,模型虽然偶尔将“极端”降水误分类为“弱”,但主要将其分配到“中等”、“强”或“极端”类别中。对于“弱”水平,模型正确预测了99%的弱降水实例。
  • F1分数:ERA5+SIA模型在1小时提前时间的F1分数为“弱”水平0.9774,“中等”水平0.4670,“强”水平0.2033,“极端”水平0.0323。随着提前时间的增加,模型性能逐渐下降,例如对于强事件,F1分数从T+1的0.2033下降到T+5的0.0265。

(三)推理阶段实验
在推理阶段,将AlertaRio数据与GFS模型结合使用。以2024年12月20日的降水预报为例,模型能够成功检测到强降水事件的发生,但在不同提前时间的降水测量值与目标值之间存在差异。例如,在T4时刻,目标降水突然飙升至40 mm/h,而模型预测为30 mm/h,这表明模型能够识别重大事件,尽管存在时间和数量上的差异。

六、结论与不足
本研究通过数据融合技术,将地面站降水数据与ERA5再分析模型数据进行整合,并利用STConvS2S模型进行降水临近预报。研究结果表明,该方法在预测极端降水事件方面具有一定的优势,尤其是在1小时提前时间的预报中表现较好。然而,该研究也存在一些不足之处。首先,模型倾向于低估降水水平,尤其是在极端降水事件中。其次,随着提前时间的增加,模型性能逐渐下降,这表明在更长时间尺度的预报中,模型的准确性有待提高。此外,由于ERA5和GFS模型的空间分辨率为0.25度,这限制了研究中时空网格的空间分辨率,可能影响对局部降水事件的捕捉能力。

七、讨论
本研究的讨论部分主要集中在以下几个方面:

  • 数据融合的优势:通过整合多个地面站的数据,能够提高数据的完整性,尤其是在捕捉罕见极端降水事件方面。这种方法有效地利用了不同站点的数据,克服了单一数据源的局限性。
  • 模型性能的局限性:尽管模型在短时间尺度的预报中表现出较好的性能,但在长时间尺度的预报中,性能下降明显。这可能与降水过程的复杂性以及模型对数据的依赖性有关。未来需要进一步改进模型结构或开发新的模型来提高长时间尺度的预报能力。
  • 空间分辨率的限制:当前使用的ERA5和GFS模型的空间分辨率为0.25度,这对于局部降水事件的精确预报可能存在一定的局限性。未来的研究可以考虑使用更高空间分辨率的数据,如ERA5-Land再分析模型,以提高预报的精度。

八、未来工作
未来的研究方向包括:

  • 提高空间分辨率:探索使用更高空间分辨率的再分析模型,如ERA5-Land,以提高时空网格的空间分辨率,从而更好地捕捉局部降水事件。
  • 整合更多数据源:将更多的地面站数据(如CEMADEN的站点)纳入数据融合算法中,以进一步提高数据的完整性和代表性。
  • 模型改进:研究新的深度学习架构或改进现有模型,以提高长时间尺度的降水预报能力。此外,还可以考虑引入更多的气象变量,以提高模型对降水过程的理解和预测能力。
  • 偏差校正技术:开发偏差校正技术,以调整模型对降水水平的预测,特别是对于极端降水事件的预测。可以尝试使用对数变换归一化方法来处理降水数据的右偏分布问题。

以上是对文章的详细解读,如有不当之处欢迎批评指出!也可以私信小编(Earth_Ai)。


来源: ”EarthAi“公众号
           https://mp.weixin.qq.com/s/D4j3ev-0ZWtCuxC6TW9sew
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表