返回列表 发布新帖
查看: 2|回复: 0

解码《政府工作报告》与“十五五”规划纲要中的新词热词 - 高质量数据集

[复制链接]

38

主题

17

回帖

186

积分

注册会员

积分
186
发表于 昨天 21:15 | 查看全部 |阅读模式
完善数据标准体系和质量管理体系,加快建设人工智能语料库,面向能源、交通、制造、教育、健康、金融等领域建设高质量数据集,建立人工智能训练数据合理使用制度。——“十五五”规划纲要

什么是高质量数据集?在国家气象信息中心数据研究室主任、正研级高级工程师张志强看来,我国数字经济进入了“以质取胜”的新阶段。“过去我们总强调数据要‘大’,现在更看重‘精’。没有高质量的标注和清洗,再好的算法也只是‘沙滩上的建筑’。”

事实上,气象部门在这场“数据质量革命”中早已先行一步。

气象部门自主研制的全球大气再分析产品(CMA-RA V1.5),全面支撑中国气象局“风清”“风顺”等模型的训练,打破了我国气象模型依赖国外训练数据集的“数据锁”困境。成果于2025年向全社会发布并入选国家数据局“高质量数据集典型案例”。

张志强认为,高质量数据集须具备时空一致性、高分辨率与无缝隙、长序列与代表性、可溯源与标准化四个关键特征。“这些特征直接决定了气象模型的‘视力’。”

面向“十五五”,气象部门围绕高质量数据集还有更大的棋要下。

首先是强化标准引领的顶层设计。制定气象数据集国家标准与行业规范,建立数据质量认证体系,统一数据处理准则,降低产业沟通成本。

其次是构建场景驱动的数据供给模式,面向低空经济、新能源等产业定制专属数据集,赋能新质生产力。

最后是发挥链主聚合作用,搭建可信数据环境,推动多领域数据融合,实现数据要素价值倍增。“我们要实现的不只是数据开放,更是‘数据要素×’的叠加效应。”张志强说。

《中国气象报》2026年3月16日 第02版

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表