https://mp.weixin.qq.com/s/HfLoygpO77eZuVWVDo1caA
国家青藏高原科学数据中心 2026年1月19日
近期,国家青藏高原科学数据中心作为科研论文关联数据仓储, 发布共享了“基于卫星雷达和雨量计融合的东亚地区高分辨率(0.01°)逐小时降水数据集(2017-2022)”。该数据集由北京大学城市与环境学院王开存教授团队完成,用户可开放获取。关联论文以“Hourly, kilometer-scale precipitation merged from rain gauge, ground-based radar and satellites over east Asia: Methods, evaluation and applications”为题发表在Journal of Hydrology。该文共有两位作者,王开存教授为通讯作者,第一作者为王开存教授指导的博士生夏涵梦。
本数据为2017.3-2022年以中国为中心的东亚区域(72.6°E-135.6°E,15°N-54.2°N)逐小时,0.01°分辨率的降水格点产品。数据是基于卫星遥感反演、雷达观测和雨量计观测,利用概率密度(PDF)匹配法、机器学习算法(XGBoost)和最优插值(OI)等算法融合而得到的。该融合降水数据集质量在不同区域、月份上都经过独立检验,评估结果均优于单一来源的降水产品。本数据为高时空分辨率的降水格点产品,可用于气象和水文等科研分析,以及人工智能模型的训练和验证。
 图1 研究区域及雷达和雨量计的覆盖与分布区域
注:(a)大约2700 个气象站的地理分布,其中用灰色十字(~2167)标记的雨量计用于训练机器学习融合算法,用红色三角形(~542)标记的雨量计用于独立验证,即测试数据集。划定了9 个分区进行区域评估。(b)地基雷达观测的有效覆盖区域。广阔的紫色区域未被观察到。
图2 在测试站点逐月评估PDF订正后的卫星和雷达降水产品及融合产品 注:对PDF订正后的卫星降水产品、PDF订正后的地基雷达降水产品及融合降水场,在测试雨量站上以0.1 mm/h阈值条件下的相关系数、均方根误差、临界成功指数、探测率、误报率和海德克技能评分等指标,进行12个月(2017–2022)数据比较分析。
图3中国九个子区域平均降水与雨量计分布密度关系及分区评估 注:(a)子区域的平均降水量与雨量站分布密度;箱线图展示了(b)相关系数、(c)均方根误差、(d)在0.1 mm/h阈值下的临界成功指数以及(e)在0.1 mm/h阈值下的探测率。所示数据分别为PDF订正后的卫星降水产品、地基雷达降水产品、基于机器学习方法生成的初猜场及经最优插值融合后的降水场。
综合评估结果表明,融合数据在绝大多数评价指标上都表现优异,且具有时间和空间上的稳健性,表明数据融合技术在提高降水估计准确性和可靠性方面的潜力。融合产品在全年和各月表现出最低的均方根误差,表明其与观测值的误差更小,预测精度更高。融合数据较高的临界成功指数突出了其在降水事件判识方面的更高可靠性,而较低的误报率表明融合数据在减少误报方面更为有效,这对于优化资源调配与提升业务预报具有重要意义。有时与单一数据源相比,融合数据的探测率略低,可能由于遗漏部分降水事件,但也可能反映了融合算法的一种有效的数据质量控制机制。单一数据源(尤其是卫星)中的许多弱降水信号实际上是噪声或伪影,融合过程通过多源信息的交叉验证,有效地识别并抑制了这些不确定性高的信号。虽然这导致了探测率的轻微下降,但它直接带来了误报率的大幅降低,最终使得综合指标临界成功指数和海德克技能评分获得显著提升。因此,这种探测率与误报率之间的权衡恰是融合方法优越性的体现,它生成了一个在业务应用中更为“可靠”和“可信”的降水场。
这项工作得到了国家重点研发计划项目(2022YFF0801302)、国家自然科学基金重点项目(41930970)的支持。
论文信息: Xia, H., & Wang, K. (2025). Hourly, kilometer-scale precipitation merged from rain gauge, ground-based radar and satellites over east Asia: Methods, evaluation and applications. Journal of Hydrology, 662, 134148. https://doi.org/10.1016/j.jhydrol.2025.134148
数据信息: |