返回列表 发布新帖
查看: 65|回复: 2

亚利桑那州立大学JGR:地球科学中的人工智能:GeoAI 视角

49

主题

22

回帖

249

积分

中级会员

积分
249
发表于 2025-8-15 16:23:34 | 查看全部 |阅读模式
https://mp.weixin.qq.com/s/rBFWt6L0ejbTxiFcXmQiTw
Wenwen Li     Geohazard   2025年08月15日

Artificial Intelligence in Earth Science: A GeoAI Perspective
Wenwen Li

摘要:GeoAI(地理空间人工智能)通过将地理空间数据与人工智能技术深度融合,在环境监测、预测建模和决策支持方面展现出变革性的潜力。这篇评论基于作者在美国地球物理联盟(AGU)2024 年会上所做的 Greg Leptoukh 讲座,探讨 GeoAI 在应对紧迫地球科学挑战中的不断演进——从北极环境变化到飓风多发热带地区的灾害响应。文章重点介绍了 GeoAI 对多模态地球观测数据的驱动式分析进展,涵盖结构化遥感影像、半结构化数据以及自然语言文本。通过引入知识图谱与生成式 AI,GeoAI 实现了跨领域数据的无缝整合、语义推理与知识推断,进一步增强了其能力。GeoAI 正在打通信息学与领域专业知识之间的壁垒,为地球科学塑造一个更加智能、可操作的数字化未来。

要点
• GeoAI 通过基于人工智能的地球观测数据分析,支持环境监测与决策制定
• GeoAI 借助多模态地球数据与生成式 AI,深化对复杂地球系统的理解
• GeoAI 需要经过科学验证与可重复性检验,才能为地球科学研究提供可靠、可信的支撑

通俗摘要
2024 年 12 月,我在美国地球物理联盟(AGU)秋季会议(华盛顿特区)上做了 Greg Leptoukh 讲座。演讲中,我探讨了人工智能(尤其是其地理空间分支 GeoAI)如何帮助科学家更高效地处理和分析庞大而复杂的地球观测数据。这篇评论总结了讲座的核心内容,重点介绍 GeoAI 与地球科学交叉领域的重要研究,并讨论了利用 AI 打造更智慧、可持续的地球数字未来所面临的持续挑战与未来方向。

1 引言
对地球科学而言,这既是一个令人振奋的时代,也是一个充满挑战的时代。一方面,前沿的地球观测(EO)技术已能产出具有超高空间和时间分辨率的海量数据,驱动科学发现并解决复杂的社会问题;另一方面,这些数据体量巨大、覆盖范围与时间跨度不一,格式与模态多样,使得数据整合与分析成为重大难题。传统科学研究常陷入“80/20 困境”:80% 的时间花在“前科学”阶段——数据发现、检索、整合与探索性可视化——仅有 20% 用于真正的分析与发现(Ruiz, 2017)。在大数据时代,如何利用多样化 EO 数据的挑战日益凸显。

幸运的是,人工智能(AI)与深度学习等新兴分析技术的出现,以及计算能力的快速提升,推动了地球科学信息学的发展。该交叉学科由 Greg Leptoukh 博士等先驱者奠基,旨在利用信息学与数据科学加速地球科学发现。近年来,GeoAI(地理空间人工智能)(Li, 2020)作为 AI 向“地理”领域延展的跨学科方向,正在推动地球科学信息学的全面进步,贯通“数据—知识”生产链的各个环节(见图 1)。那么,GeoAI 中的“Geo”究竟指什么?简单来说,就是将 AI 应用于地理空间场景。2012 年前后 AI 的爆发式进展,主要得益于其在图像分析中可并行且高效的特征提取能力;而地球科学拥有大量遥感影像,因此成为 AI 的天然试验场。过去十年,先驱性研究已利用 AI 分析卫星影像与其他遥感数据,以刻画环境变化(Li & Hsu, 2022)。例如,AI 与深度学习被用于作物类型分类与产量预测(Joshi et al., 2023),也被用于洪水、滑坡等灾害制图与变化检测(Bonafilia et al., 2020)。此外,AI 还用于大范围土地利用/覆盖制图,生成高分辨率基础数据产品(Brown et al., 2022),并绘制基础设施与北极多年冻土融化图,帮助理解环境变化对社区的影响(Yang et al., 2023)。

图 1 GeoAI 赋能的地球科学“数据—知识”生产链示意图。整条链条的每一个环节都面临独特的地理空间挑战:•  地球观测数据在空间/时间分辨率、格式和地理覆盖上差异巨大,共享与整合难度大;• 数据分散在多个源,常位于深层网络,发现和检索困难;• 地球数据具有多维、实时特性(如天气预报),可视化与分析门槛高。GeoAI 在整条链中扮演核心角色,用于打通数据壁垒、提升发现效率,并实现智能的可视化与分析。

我们将 GeoAI 称为一门新兴交叉学科,但它与“把 AI 应用到地理领域”究竟有何不同?答案是肯定的,GeoAI 有其独特属性。Li 等人(2024)最近提出了“GeoAI 科学”的关键研究方向:
  • 空间显式建模:将空间自相关、空间异质性等地理学原则嵌入 AI 模型,兼顾全局模式与局部差异,提升预测能力。
  • 多源多模态建模:整合多光谱卫星影像、数值模拟输出、自然语言文献、音频、视频、传感器网络等多种模态数据,为地球环境与气候变化提供互补视角。
  • 时空多尺度联合学习:通过整合空间、时间和不同地理尺度,实现地球系统变化的整体建模,利用近实时监测捕捉动态环境变化。
  • 地理约束的模型训练与验证:不同地区的气候、地貌、人文因素各异,这些约束为训练和验证 GeoAI 模型提供了独特机会,提高其地理可迁移性。
这些要素使 GeoAI 不仅是 AI 的“应用”,更是专门解决地球科学时空复杂性的学科。

地球科学领域的一项开创性 GeoAI 建模成果是 Prithvi-EO——一个基于时间序列 EO 数据训练的新型地理空间 AI 基础模型,覆盖国家与全球尺度,能够提炼地球表面变化的独特语义与光谱特征(Szwarcman et al., 2024)。除 EO 数据外,Prithvi-EO 还融合了位置与时间嵌入,使其泛化与迁移能力显著优于传统任务特定模型(Hsu et al., 2024)。作为融入“地理”领域数据与知识的基础模型,Prithvi-EO 已在灾害制图、时序土地利用/覆盖分类、地上生物量估算等广泛地理空间应用中展现了卓越性能,进一步彰显了 GeoAI 建模范式的威力。

下一节将介绍两个跨学科研究项目,展示 GeoAI 如何在科学与社会服务中发挥关键作用。

2 GeoAI 在行动:破解地球科学难题

2.1 GeoAI 近实时追踪多年冻土融化,为气候行动提供决策依据

过去十年,北极地区经历了剧烈变化,景观变迁速度日益加快。核心问题在于北极多年冻土——连续两年以上处于 0 °C 或更低温度的冻结地面。随着气温升高,冻土融化导致地表沉陷,引发湖泊排干、海岸侵蚀和滑坡风险上升等一系列环境变化。这一过程威胁着生活在北极的 500 万居民,使社区面临关键基础设施损毁等连锁冲击。为此,Permafrost Discovery Gateway(PDG;Liljedahl et al., 2022)研究团队开始利用大数据与 GeoAI,对多年冻土变化进行近实时监测,为社区规划和气候适应提供科学支撑。

GeoAI 在破解以下关键难题中发挥核心作用:

1. 超高分辨率卫星影像解析——GeoAI 可识别冻融指标,如地下冰状况和热喀斯特地貌(retrogressive thaw slumps)。

2. 多模态数据融合——通过整合不同模态的 EO 数据,例如:
• 高程数据检测地表塌陷;
• 植被指数(NDVI)评估植被破坏;
• 光学/近红外影像揭示地表变化;
从而更全面地理解冻土融化过程。

图 2 展示了 PDG 中 GeoAI 驱动的泛北极尺度大数据制图流程:
  • GeoAI 模型接收多模态输入;
  • 深度学习特征提取得到特征图(feature maps);
  • 特征融合模块(Li et al., 2025)强化特征;
  • 解码器进行分割或检测,识别出融沉滑坡、湖泊排干等现象。
随着模型规模扩大(如 Transformer 架构)和数据量激增,训练和部署对计算资源的需求显著上升。对于区域尺度任务,6–8 张 A5000 GPU(24 GB 显存/张)即可胜任(Li et al., 2025);而泛北极尺度预测可能需要数千 GPU·小时的高端 A100。计算需求取决于研究区范围、影像分辨率及模型大小。在精度与算力之间取得平衡,是大规模部署 GeoAI 模型的关键考量。

图 2 展示了GeoAI驱动的智能化、可扩展制图工作流,用于大规模多年冻土数据生成。该流程以多模态卫星与辅助数据为输入,通过深度学习特征提取、融合与解码,自动识别并绘制泛北极范围内的热喀斯特滑坡、湖泊排干等冻融地貌,最终生成用于科学分析与社会决策的多年冻土大数据产品。
图注照片来源:湖泊排干(Benjamin M. Jones)、热融滑坡(Scott Zolkos)、基础设施(Chandi Witharana)。

49

主题

22

回帖

249

积分

中级会员

积分
249
 楼主| 发表于 2025-8-15 16:28:36 | 查看全部
(接上篇)

除制图外,GeoAI 还能整合气候数据、地形因子及冻融触发因素(如野火),突破现有观测局限,实现季节性突发融化的预测——指明未来何时何地可能发生冻融事件。现有数值模型多将冻土融化视为缓慢的长期过程,对突发融化事件缺乏准确刻画。借助 GeoAI 挖掘海量数据中的时空关系,研究者可在多年冻土科学上实现关键飞跃,提升理解与预测能力。

这些科学信息对于深化北极多年冻土认知、支持受影响社区至关重要。通过及时揭示冻融风险与速率,我们可帮助社区规划因融沉损害而需搬迁的村落,加固如阿拉斯加输油管等关键基础设施,并指导新建设施适应不断变化的环境。

2.2 GeoAI 构建“地理”知识图谱,助力灾害响应与人道救援

GeoAI 的另一大用武之地,是通过构建大规模知识图谱,实现跨领域数据的自动化、智能化整合。这一研究可追溯至 21 世纪初 Tim Berners-Lee 等人提出的“语义网”愿景(Berners-Lee et al., 2001):网页内容以可被机器理解的语义标签进行标注,使人类与机器都能轻松消化信息。该理念深刻影响了地球科学。地球科学信息学长期致力于将语义网原则与地球科学数据融合,其中最具代表性的成果是 NASA JPL Robert Raskin 博士团队开发的 SWEET 本体(Semantic Web for Earth and Environmental Terminology;Raskin & Pan, 2005)。SWEET 作为知识骨架,已广泛用于语义消歧、查询扩展及跨领域 EO 数据关联检索(Pouchard et al., 2013),并被极地研究社区积极采纳,以提升元数据共享与语义互操作性(Parsons et al., 2023)。

知识图谱是 SWEET 等本体框架的自然延伸,通过在统一图结构中连接多学科海量数据,支撑快速决策。该方向的先驱之一是 KnowWhereGraph(Janowicz et al., 2022),它将地球及其环境的半结构化和非结构化地理空间信息整合进一个互联图,增强空间推理能力,并在“人—环境”系统交汇处实现更有效的分析与决策。KnowWhereGraph 有两大独特优势:

1. “Know”能力:跨域数据、信息与知识的快速连接与实时汇聚,可在灾害等紧急情境下迅速拼装实时信息;

2. “KnowWhere”能力:以“位置”为钥匙串联跨域数据,支持位置智能,帮助终端用户做出知情决策。

GeoAI 对实现这两大能力至关重要:
• 为丰富 KnowWhereGraph 的“地理”知识,GeoAI——尤其是地理知识引导的大型语言模型——被用来从自然语言文本及其他数据源中高精度抽取地理实体及其空间关系。与一般信息抽取不同,GeoAI 需指导大模型识别地理实体的独特特征,并创新性地整合多源信息(如地名词典)以消歧地名等地理知识。
• GeoAI 也用于图嵌入:将实体类型、几何信息及空间关系编码进知识图谱,进一步丰富知识表征(Hu et al., 2025)。

这种高度互联、位置感知的知识图谱,已成为 NASA 关键应用领域——灾害备灾与应急响应——的宝贵知识库。通过图 3 所示的新型地理可视化前端,图谱数据帮助利益相关者快速建立对受灾区域、受损程度及连锁事件的态势感知;同时揭示社会经济与健康画像,使救援专家能够识别脆弱社区并支持疏散行动。更进一步,GeoAI 还可推断二阶、三阶影响,回答“假设”类问题,识别不同行动方案下可能需要的减灾与救生措施。

图 3 展示了 GeoAI 与知识图谱驱动的决策工具 GeoGraphVis(Li et al., 2023)在灾害响应中的应用示例。界面中央的地图以 Hurricane Harvey 受灾区域为焦点,实时呈现了各地区的无保险覆盖率(uninsured rate)。用户还可单独或叠加查看其他灾损信息及健康相关因子,从而快速形成对受灾区域的多维态势感知,为救援与资源调配提供精准支持。

3 未尽挑战与未来研究方向
上文介绍的两个项目代表了 GeoAI 发挥关键作用的两大研究分支:北极项目把 AI 在图像分析、计算机视觉上的能力拓展到多年冻土大数据生成;知识图谱项目则把 AI 在自然语言处理上的威力延伸到跨(地理)领域信息整合与空间推理,以回答关键决策问题。尽管进展令人振奋,GeoAI 仍面临诸多挑战,需要持续研究才能突破科学瓶颈、回应社会需求。除了 AI 本身众所周知的局限——可解释性、伦理与责任、开放 AI——我还想强调 GeoAI 在地球科学中的几项关键议题。

3.1 GeoAI 建模成果的系统科学验证
GeoAI 能在前所未有的尺度与分辨率下处理海量观测数据并产出科学数据产品,但针对这些产品的严格科学验证仍显不足。例如,PDG 团队首次生成了 5 TB 的泛北极冰楔多边形(IWP)数据集,通过对超高分辨率卫星影像做分割完成(Udawalpola et al., 2021)。该数据集对评估与多年冻土融化直接相关的地下冰状况极有价值。

从 GeoAI 研究角度看,评估通常用未参与训练的 IWP 标注样本来计算性能指标。然而,从科学分析角度看,还需在北极多样地貌中,用地面真值做系统验证。问题在于,这种地面真值采集往往需要大规模野外或人工工作,难以实现;且野外数据与卫星影像的采集年份常不一致,易产生差异。要让 GeoAI 数据在后续科学研究中真正可信,地球科学界与信息学界必须携手建立系统化的评估框架。只有构建稳健的验证方法,才能弥合 AI 结果与现实世界科学适用性之间的鸿沟。

3.2 面向地球科学的可复现 GeoAI
“可复现的地球科学”并非新话题,学界早已认识到开放科学——共享数据、方法与成果——对持续创新的重要性。然而,GeoAI 模型结构复杂,涉及数据细节、模型参数、训练微调、评估方式等众多环节,使得计算层面的复现极具挑战(Reinecke et al., 2022)。同时,GeoAI 的学习曲线陡峭,尤其在气候预测等复杂问题上,对科学界构成门槛。

为此,需要新的方法来记录、测试并确保 GeoAI 模型能顺利配置与运行。生成式 AI 工具(如大语言模型)有望自动化生成文档并进行复现测试。设想一个“自主复现代理”,承担双重角色:

1. 从现有代码自动生成文档,并通过与模型开发者的自然语言交互澄清细节;

2. 充当测试代理,依据文档验证模型能否成功部署并复现预期结果。

通过“迭代—再测试”的代理范式,可显著减少人力投入,提升 GeoAI 模型的计算可复现性。

比计算复现更难的是可复制性,或更确切地说,是 GeoAI 模型的泛化能力(Goodchild & Li, 2021)。在某个地理区域训练的模型,因空间异质性,在另一区域可能给出不同预测结果。Goodchild 与 Li 将这种现象称为地理研究“弱可复制性”。正因如此,计算复现——在相同数据、相同模型、相同研究区下得到一致结果——显得尤为关键。当研究者迁移已有 GeoAI 模型时,必须首先确保在完全一致的设置下能复现原结果;同时应清晰说明研究的假设、约束与情境边界,使他人能准确理解并恰当解读结果。

3.3 生成式与确定性 AI 在地球科学中的融合
迄今为止,GeoAI 在地球科学中的应用大多聚焦于“确定性”任务:从 EO 数据中提取已有信息。第二节介绍的两大项目——卫星影像分析和半结构/自然语言数据中语义信息抽取——均属于此类。近年来,生成式 AI 的兴起为 GeoAI 带来全新可能。与确定性任务不同,生成式 AI 能够创造新内容(图像、视频、文本、自然语言回答等)。这至少可在三方面推动地球科学 GeoAI:

1. 自动生成具有期望方差和分布的训练图像,提升影像分析模型的性能;

2. 自动化科学工作流生成——地球科学信息学研究者长期致力的方向(Fox et al., 2009);

3. 借助生成式 AI 的意图理解能力,再与确定性 GeoAI(如排序)结合,实现跨数据中心(如 GES DISC;Leptoukh et al., 2002)的地球数据产品语义搜索。

然而,生成式 AI 也是一把双刃剑:其输出可能“编造”答案,而确定性任务的结果直接源于现有数据。为降低风险,可通过多种交叉验证策略:

• 多模态数据输入;

• 独立开发的工作流;

• 生成式与确定性并行的多元求解框架。

生成式与确定性 GeoAI 的融合,有望带来更自动化、更智能的地球科学问题解决方案。

49

主题

22

回帖

249

积分

中级会员

积分
249
 楼主| 发表于 2025-8-15 16:29:19 | 查看全部
(接上篇)

4 结语

AI 已为地球科学带来变革式创新。本文无意面面俱到,而是结合作者经验,提供 GeoAI 视角。未来解决复杂地球科学难题,需要跨学科多元团队,而 GeoAI 将成为贯通“数据—科学—行动”的核心载体。GeoAI 研究者将扮演“翻译者”的双重角色:

1. 把 AI 应用于地球科学发现;

2. 以地理空间洞见反哺 AI 进步。
这种双向赋能将催生更强大的 GeoAI 模型,应对地球科学乃至更广领域的挑战。
对青年科学家而言,若能在地理空间分析、机器学习、遥感、数据伦理与环境/地球系统科学领域知识上同步深耕,将具备引领 AI 与地球科学交叉创新的综合能力。

随着 GeoAI 持续演进,其可靠性与广泛影响仍是紧迫议题。如何跳出“准确率”单一指标,确保模型在真实场景中的可信?高准确率模型仍可能输出有偏或难以解释的结果,亟需涵盖稳健性、公平性、可解释性的评估框架。同时,我们能否构建一套可操作、系统化的 GeoAI 研究范式,以可信、可持续、可复现、可解释为核心?这样的框架不仅指引技术进步,也将弥合研究与落地之间的鸿沟。为最大化 GeoAI 影响,我们必须让创新转化为切实、持久的价值。此刻即行动:完善评估指标、推进负责任 AI 实践,塑造一个既强大又可信的 GeoAI 未来。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表