返回列表 发布新帖
查看: 2|回复: 2

唐伟,郭转转,李欣,等:DeepSeek对气象行业的影响

13

主题

7

回帖

67

积分

注册会员

积分
67
发表于 2 小时前 | 查看全部 |阅读模式
https://mp.weixin.qq.com/s/PG5CI1B33YujROfhwWIAog
原创 唐伟, 郭转转,等  气象与环境科学  2025年09月18日

《气象与环境科学》2025年第4期刊载了:

DeepSeek 对气象行业的影响

唐伟,郭转转,李欣,李卓然,郎洪亮,周勇
(中国气象局气象发展与规划院,北京 100081)

基金项目:中国气象局发展与规划院基础研究项目(JCXM2024005)
责任编辑:王君

作者简介:
唐伟(1987—),女,江苏阜宁人,高级工程师,博士,从事气象科技战略研究.
Email:weitang@cma.gov.cn

通信作者:
周勇(1972—),男,江苏无锡人,研究员级高级工程师,硕士,从事气象发展战略、气象信息化和智慧气象相关研究.
Email:zhouy@cma.gov.cn

摘  要

近期,DeepSeek国产开源大模型引起了国内外各界的广泛关注,并借助其技术优势和开源策略,迅速在通信、金融、医疗、环保、教育和政务服务等垂直领域得到应用。DeepSeek在气象部门的部署应用,有助于夯实气象科技自立自强基础,促进业务全面智能化转型;促进供给与需求精准对接,助力实现智慧气象服务;提供新的管理工具;带动气象产业规模增长和效率提升。同时,也对气象专业化应用、气象治理、风险管理带来新的挑战。因此,在部署和应用DeepSeek时,应加强政策引导和机制建设:构建自主可控、弹性可扩展的人工智能气象应用技术支撑体系;结合DeepSeek技术特点和气象业务服务需求,有序推广应用;灵活运用多种政策工具,强化人工智能大模型气象应用治理;借鉴杭州政府和DeepSeek企业成功经验,营造完善的气象科技创新生态。

关键词
DeepSeek;气象;人工智能;大模型

引 言

近年来,生成式人工智能(Artificial Intelligence,AI)技术蓬勃发展。自2017年Vaswani等提出Transformer架构(即“注意力机制”,可高效建模长序列依赖)以来,大规模预训练已成为生成式AI领域范式。作为一类能够自主生成新内容(包括文本、图像、音频和视频等)的技术,生成式AI预训练模型通过学习已有数据模式、规则等来创造全新的数据实例。该能力已在多个科研与产业领域取得了实质性成果,以前所未有的速度改变着各行各业运行模式。在气象领域,生成式AI可用于生成全球和区域天气预报和气候预测,从而提升天气预报的时效性和准确率;在材料科学领域,DeepMind开发了图神经网络模型GNoME,一次性预测出超过220万种潜在新型晶体材料,其中38万种被评估为高度稳定,大幅加速了新材料的发现;在生命科学中,生成式AI辅助发现并设计出新药物——如利用生成式AI所研制的抗肺纤维化药物INS018_055已获得FDA孤儿药资格认证;在教育领域,AI导师被证实能大幅提升学习效率,一项随机对照实验表明,学生在使用AI导师系统学习时,短期内学习成绩提高了127%。这些案例显示出生成式AI在计算效率、创新能力和任务转化方面的巨大潜力。

支撑这一变革的,是底层大模型能力的跃迁。在Transformer架构基础上,以BERT和GPT为代表的大模型展现出强大的语义建模与泛化能力,而ChatGPT的推出则标志着通用人工智能的起点和强人工智能的拐点,是里程碑式的技术进步。

随着多模态大模型的发展,从图文对齐模型,到生成图像的扩散模型,再到能够理解图文并生成复杂推理输出的预训练大模型等,预示着生成式AI正朝着“通用人工智能”迈进。全球多家机构在这一趋势下纷纷投入研发。国际上,OpenAI构建的GPT-4已支持多模态输入,在复杂推理任务中表现出接近专家水平的能力;谷歌DeepMind于2023年发布的Gemini模型聚焦图文推理与科学应用;Meta则以开源为特色,其LLaMA系列降低了大模型开发门槛。与之相比,中国的大模型研究虽起步略晚,但在算法机制与应用落地方面进展迅速。百度的ERNIE系列探索知识增强预训练路径,提升中文理解与生成效果;清华智谱团队提出GLM系列,创新性引入自回归填空机制,增强推理与生成统一性;华为的盘古大模型则在语言与科学计算两个方向并进。2025年1月,开源大模型DeepSeek-R1发布。该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、编程、自然语言推理等任务上表现出色,性能比肩美国OpenAI o1大模型,而训练成本仅为后者的3%~5%。DeepSeek-R1一经发布,即受到多国政府、企业和学术界的广泛关注。

在政府方面,DeepSeek除在国内得到支持外,其他多国政府也对其技术创新和应用潜力表现出浓厚兴趣,在一定程度上反映了我国人工智能技术的快速发展与竞争力提升。在企业界,众多企业已将DeepSeek视为推动数字化转型和商业智能的关键工具,中国电信和国家能源集团等国有企业、华为和腾讯等国内民企,以及英伟达和微软等外国企业已陆续接入DeepSeek,人工智能大模型领域竞争企业(如OpenAI、Meta、Google、xAI等)也对DeepSeek所取得的成就给予了高度评价。在学术界,DeepSeek取得的技术突破及其开源策略赢得了广泛认可。2025年1月,《Nature》杂志发文称“中国开发的大语言模型DeepSeek-R1以亲民价格和开放性挑战了OpenAI推理模型GPT o1的地位,令科学家们感到兴奋”。图灵奖得主杨立昆(Yann LeCun)表示,DeepSeek的成功得益于其开放生态和基于前人成果的持续迭代。调研显示,DeepSeek在气象行业领域也有广阔的应用场景。本文概述了DeepSeek的主要特点和应用情况,并从气象业务、服务、治理和产业发展等方面深入分析了其对气象行业的影响。

1 DeepSeek主要特点和各领域应用概况

DeepSeek具有低成本、高效率、高性能等特点,而且采取开源策略,促进技术社区的合作与创新,从而大幅降低了开发与使用门槛,迅速在通信、金融、医疗、环保、教育和政务服务等多个垂直领域得到应用。

DeepSeek主要技术创新点有3点。首先,采用强化学习进行训练,从零开始让模型在无监督微调的情况下自然涌现出链式推理、自我验证和反思等高级行为。其次,采用混合精读计算,在部分模块中保留高精度运算以确保数值稳定性,其他部分模块则降低计算精度,减少运算量和通信量,从而提高总体运行速度。第三,优化负载均衡,并直接编写底层代码以充分利用GPU的并行计算能力,最大程度提高硬件使用率。此外,融合多种已有技术并实现集成创新,也是DeepSeek的主要成功之处。目前,DeepSeek在垂直领域应用方面已呈现出多维度落地、百花齐放的格局,通过提升效率(如提高推理计算效率、提升文件审核速度)、降低成本(包括部署成本和训练成本)、增强智能化水平(如医疗诊断、文档写作),形成了一批典型应用案例和覆盖“政企学研”的规模化应用格局,同时激发了人工智能人才虹吸效应与学术创新突破。

2 DeepSeek给气象领域带来的新机遇

气象事业是科技型、基础性、先导性社会公益事业,涉及到气象监测、气象预报预测、气象服务、气象防灾减灾、应对气候变化、开发利用气候资源、人工影响天气等方面工作。对气象领域而言,DeepSeek也为行业降本增效带来了新机遇。

首先,DeepSeek部署应用,有助于夯实气象科技自立自强基础,促进业务全面数智化转型。在算力建设方面,DeepSeek与国产算力芯片相结合,能够降低对进口图形处理器(GPU)的依赖。在科创平台方面,作为性能最佳的开源模型之一,基于DeepSeek建立开放式科创平台,更易实现技术社区的合作与创新。在预报大模型方面,由于DeepSeek免费开源,便于取其精华,将其中的先进功能或模块集成到现有气象大模型中,实现优势互补,加快提升“风雷”“风清”“风顺”等气象大模型的性能。此外,DeepSeek在数智预报员助手、观测基础设施运维保障、多元数据处理、程序代码自动生成、可嵌入开发环境建设、情报收集分析和决策咨询指引等方面也有广泛的应用前景。

其次,DeepSeek部署应用,能够促进供给与需求精准对接,助力实现智慧气象服务。在服务大模型方面,DeepSeek高效训练架构、MoE模型、知识蒸馏技术、通信与计算协同优化、混合精度加速计算等技术,为解决“风和”大模型实时运行算力资源需求过大的问题提供了一种可行方案。在专业服务方面,DeepSeek有助于提升用户服务需求的智能感知能力,并提高个性化气象服务产品生成效率和质量。此外,DeepSeek的大规模应用,有助于形成统一接口标准,为气象服务系统跨部门安全接入或部署创造有利条件。

13

主题

7

回帖

67

积分

注册会员

积分
67
 楼主| 发表于 2 小时前 | 查看全部
(接上文)

第三,DeepSeek部署应用,提供了新的管理工具,同时对气象治理带来新挑战。DeepSeek有助于实现智能文档处理、工作流程自动化和数据驱动的精准决策,推动人工智能应用从“效率工具”转向“治理赋能”。DeepSeek具备展示逻辑推理过程的功能,在一定程度上增强了算法透明度,有助于建立信息溯源机制。DeepSeek为更多公民、法人和其他组织参与提供气象应用服务创造了条件,同时将加大气象信息发布与传播、数据安全等监管难度,并使气象治理结构和治理范围发生变化。治理结构变化突出表现在,DeepSeek现象凸显了中小型科创企业在人工智能发展和治理中的重要地位和作用,既是重要的治理主体,也是重要的治理对象。此外,DeepSeek加速了人工智能大模型的推广应用,使人工智能气象应用法规制度建设任务更为紧迫。

第四,DeepSeek部署应用,将带动气象产业规模增长和效率提升。DeepSeek有望通过智能化服务催生更多市场需求,吸引更多行业用户和消费者的关注与信赖,从而为气象产业注入新的增长动力。其开源特性和低成本优势,将会吸引更多中小企业和个人参与气象服务产业,促进气象产业主体多元化。DeepSeek还将提升产业链整体运行效率和竞争力。在产业链上游,DeepSeek将推动算力硬件、智能观测设备、数据资源等的高效利用和整合;在产业链中游,气象服务提供者可以利用DeepSeek优化气象预报算法和服务模式;在产业链下游,DeepSeek能够促进气象与其他产业的深度融合,提供更加智能的行业解决方案。

3 DeepSeek给气象领域带来的新挑战

DeepSeek在气象领域应用时也有一定的局限性。如因气象专业知识欠缺,在对话过程中可能会产生AI幻觉,对用户的专业知识和甄别能力提出了挑战。此外,在气象领域DeepSeek应用也存在对专业数据分析能力不强、可解释性差等生成式AI模型在各垂直领域应用中的共性问题。

DeepSeek的开源特性也为其在气象部门业务化部署带来新的风险,突出表现在以下两个方面。第一,在基础设施方面,算力需求可能不降反升,并使统筹建设难度加大。一方面,DeepSeek的发布打破了大模型训练必须大规模堆叠GPU算力的市场共识,相较于早期大模型,算力资源需求和训练费用大幅降低。但这或将引发杰文斯效应(Jevons Paradox),即技术进步提高资源利用率,而降低成本却导致需求数量增加,从而导致资源需求总量上升。另一方面,由于开发和使用门槛降低,更多部门或地方将具备自建人工智能大模型系统的条件,从而加重了统筹管理的压力。第二,在业务转化方面,DeepSeek的开源特性,将为业务应用带来新风险。DeepSeek是开源大模型,可自由用于试验和测评,但将其投入核心业务应用,将面临更多安全、运维和迭代升级等方面的新风险。首先是安全风险,开源软件的代码公开,可能被恶意攻击者研究并发现漏洞实施破坏。其次是运维风险,与商业软件不同,开源软件通常没有官方的技术支持,可能导致遇到问题时无法及时解决。第三是迭代升级风险,开源软件的不稳定性也可能导致业务项目中断或更新停滞。

4 结论与讨论

在“百模大战”的今天,由杭州的幻方量化公司孵化出的DeepSeek能够火“出圈”,其成功源于多方面的优势,包括精准的市场契合度、强有力的资本支持、扁平化的团队管理方式等。其中不容忽视的一点是杭州这个城市对企业创新的政策引导和支持。据统计,2019年至2024年8月,杭州市委、市政府和科技部门制定了50项重要创新政策。其中,市委、市政府政策占七成,多达35项。总体而言,这些政策为杭州科技企业提供了多项优惠和支持,包括税收减免、资金扶持等,降低了创业初期的运营压力,吸引了大量科技公司在此落户。

DeepSeek作为一款具有低成本、高效率、高性能等特点的开源大模型,已在多个垂直领域展现出广泛的应用潜力和价值。在气象领域,DeepSeek的全面融入有助于夯实气象科技自立自强基础,促进业务全面数智化转型,提升气象服务的智能化水平和精细化程度,有望带动气象产业规模增长和效率提升。同时,尽管DeepSeek在气象领域的应用前景广阔,但也对气象专业化应用、气象治理、风险管理等带来新挑战。面对新的挑战和机遇,借鉴杭州政府和DeepSeek企业的成功经验,加强DeepSeek在气象领域中的应用需要从多方面加强政策引导和机制建设。

4.1 构建自主可控、弹性可扩展的人工智能气象应用技术支撑体系

以“数据筑基、算力强基、人才固基”为核心,充分发挥企业创新主体作用,完善产学研结合模式,以应对人工智能技术快速迭代、国际竞争加剧及气象业务需求日益复杂的形势。

在数据筑基方面,需要加快收集整合多源气象数据,分类构建标准化、高质量的气象数据集。整理并数字化国内外气象出版物,建立完备的气象语料库。优先开展历史灾害数据和极端天气案例的归集与标注。搭建“数据沙盒”平台,在保障安全的前提下推动数据共享。

在算力强基方面,需要进一步提高国产芯片和设备采购比例。推广混合精度计算(预报预测模型应用采用高精度,文档写作和一般管理类模型应用采用较低精度)与内存优化技术以提高算力资源利用率。加快分类部署DeepSeek大模型,预报预测类核心业务模型在业务内网环境中部署,规避风险;非核心业务类模型,可以部署在互联网环境中,以保证知识的动态更新。气象部门是垂直管理部门,应在国家级统筹开发和训练DeepSeek大模型,并在各省气象部门分布推理和应用。

在人才固基方面,需要用好雄安人工智能创新研究院的灵活机制,聚集全国的人工智能气象应用人才资源。完善人工智能气象应用领军人才选拔标准,引进或培养骨干人才。联合高校设立气象科学与人工智能交叉学科,培养复合型人才。扩大干部职工人工智能应用技术培训面,并把针对DeepSeek等大语言模型的提问技巧、输出结果甄别和合理使用方法等纳入科普教育内容。

4.2 结合DeepSeek技术特点和气象业务服务需求有序推广应用

构建自主可控的气象算力基座。推动DeepSeek技术与国产算力芯片的深度融合,重点突破气象领域算力自主化瓶颈。通过优化模型架构与国产芯片的适配性,建立高性能、低能耗的算力环境,系统性降低对进口GPU的依赖,保障气象数据安全与战略自主性。

统筹气象大模型语料库建设。系统梳理气象观测数据、预报产品、历史资料、科研文献等多源异构数据资源,建立统一的数据标准和采集规范。开发智能化数据标注工具,提升标注效率,完善气象术语库、案例库和知识图谱,为气象大模型的训练提供高质量、多样化的语料支撑。通过建立开放共享机制,促进跨部门数据资源的有效利用和持续更新,为气象大模型的研发和应用提供坚实的数据基础。

推进现有气象大模型升级迭代。充分利用DeepSeek的开源特性,定向提取其通信计算协同优化、混合精度加速计算等模块,通过代码改写实现“风雷”“风清”“风顺”等气象预报大模型的优化升级。重点攻关数据-物理双驱动耦合技术,将DeepSeek的预训练知识库与气象领域知识图谱结合,增强模型的可解释性与物理一致性。通过知识蒸馏压缩模型规模的同时保持精度,推动气象大模型在省级气象部门的轻量化部署,实现预报效率与精度的双重提升。

加速气象服务领域部署应用。通过在互联网环境中部署,提升用户服务需求的智能感知能力,促进气象数据的实时更新与广泛共享,并通过云计算资源弹性扩展,确保系统高效稳定运行,满足多样化的气象服务需求。推进DeepSeek开源气象数据接口标准的制定,为今后与用户内部部署的人工智能大模型平台相衔接奠定基础。


13

主题

7

回帖

67

积分

注册会员

积分
67
 楼主| 发表于 2 小时前 | 查看全部
(接上文)

4.3 灵活运用多种政策工具,强化人工智能大模型气象应用治理

充分发挥战略规划、业务准入和标准体系等三大政策工具的协同作用,构建科学、规范、高效的治理体系。

在战略规划方面,既要明确人工智能大模型在气象领域的发展目标,持之以恒,确保技术应用与气象业务需求紧密结合;又要在技术路线、重点任务和实施路径等方面,留有一定的灵活性,在年度实施方案中滚动修订,以应对人工智能技术快速迭代。

在业务准入方面,需要针对开源系统,既要从技术成熟度、数据安全性和应用场景等进行审核,又要兼顾业务运行后的技术支撑保障能力。

在标准体系方面,在加快制修订以气象部门为主导的人工智能气象应用数据接口、算法设计、模型训练等技术标准和评估指标的同时,还需及时掌握、积极参与并酌情引入信息技术行业和人工智能开源社区标准,以确保系统间的兼容性和结果可比性,促进产学研用多方协同互动。

4.4 借鉴杭州政府和DeepSeek企业成功经验,营造完善的气象科技创新生态

DeepSeek-R1大模型固然优秀,但不久也将会被更新版本或其他模型所超越。因此,剖析其成功原因,从思想、思路和行动等不同层面,借鉴经验,努力打造出适合气象领域的“政用产学研”协同创新生态环境,将更具深远意义。

在思想层面,DeepSeek创始人梁文锋提出“中国创新不缺资本,缺乏的是信心及如何组织高密度的人才”“创新不完全是商业驱动的,还需要好奇心和创造欲”。对于气象科研工作者,面对数值预报、数据同化等核心技术差距和国际封锁,要鼓励其坚定信心、勇于突破。对于气象科技政策制定者,要敦促其在制定政策时兼顾科研人员好奇心和创造欲,给予引导和支持,而非只靠利益驱动。

在思路层面,首先可借鉴DeepSeek以开源模式促进技术共享与社区协作的思路,鼓励气象科研业务系统部分开源,加速技术优化迭代,降低研发门槛,激发多元创新。其次,借鉴DeepSeek以集成创新提升整体效能的思路,搭建开放共享平台,融合多源数据与多种算法资源,发挥聚合效应,实现更高效、更精准的数据分析和应用。第三,借鉴DeepSeek以底层代码优化提升系统性能的思路,一方面持续推进以“组件”装配方式开发气象软件,另一方面,投资支持现有“组件”代码优化以不断提高性能。

在行动层面,借鉴杭州经验,与相关部门和地方政府合作,从构建科技创新孵化器、众创空间和产学研合作平台,完善技术交易市场和知识产权保护机制,积极推动国际科技合作并参与全球创新网络,举办创新创业大赛,在创新文化和环境建设等方面,多措并举,营造完善的创新生态政策环境,并建立根据科技发展动态及时调整政策的机制。同时,借鉴DeepSeek的执行力与团队协作机制,注重细节管理,强化目标导向,确保每一项任务都能高效落地。如:尝试通过目标与关键成果法(Objectives and Key Results, OKR)体系将战略目标转化为可追踪的里程碑,运用数据看板实时展示关键数据指标,以快速了解业务状态,支持数据驱动的决策与行动,实现跨部门协同增效。

致谢:感谢许小峰、矫梅燕、戴建军、赵立成、黄小猛、匡秋明等专家对本文的指导和帮助。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表