(接上篇)
除制图外,GeoAI 还能整合气候数据、地形因子及冻融触发因素(如野火),突破现有观测局限,实现季节性突发融化的预测——指明未来何时何地可能发生冻融事件。现有数值模型多将冻土融化视为缓慢的长期过程,对突发融化事件缺乏准确刻画。借助 GeoAI 挖掘海量数据中的时空关系,研究者可在多年冻土科学上实现关键飞跃,提升理解与预测能力。
这些科学信息对于深化北极多年冻土认知、支持受影响社区至关重要。通过及时揭示冻融风险与速率,我们可帮助社区规划因融沉损害而需搬迁的村落,加固如阿拉斯加输油管等关键基础设施,并指导新建设施适应不断变化的环境。
2.2 GeoAI 构建“地理”知识图谱,助力灾害响应与人道救援
GeoAI 的另一大用武之地,是通过构建大规模知识图谱,实现跨领域数据的自动化、智能化整合。这一研究可追溯至 21 世纪初 Tim Berners-Lee 等人提出的“语义网”愿景(Berners-Lee et al., 2001):网页内容以可被机器理解的语义标签进行标注,使人类与机器都能轻松消化信息。该理念深刻影响了地球科学。地球科学信息学长期致力于将语义网原则与地球科学数据融合,其中最具代表性的成果是 NASA JPL Robert Raskin 博士团队开发的 SWEET 本体(Semantic Web for Earth and Environmental Terminology;Raskin & Pan, 2005)。SWEET 作为知识骨架,已广泛用于语义消歧、查询扩展及跨领域 EO 数据关联检索(Pouchard et al., 2013),并被极地研究社区积极采纳,以提升元数据共享与语义互操作性(Parsons et al., 2023)。
知识图谱是 SWEET 等本体框架的自然延伸,通过在统一图结构中连接多学科海量数据,支撑快速决策。该方向的先驱之一是 KnowWhereGraph(Janowicz et al., 2022),它将地球及其环境的半结构化和非结构化地理空间信息整合进一个互联图,增强空间推理能力,并在“人—环境”系统交汇处实现更有效的分析与决策。KnowWhereGraph 有两大独特优势:
1. “Know”能力:跨域数据、信息与知识的快速连接与实时汇聚,可在灾害等紧急情境下迅速拼装实时信息;
2. “KnowWhere”能力:以“位置”为钥匙串联跨域数据,支持位置智能,帮助终端用户做出知情决策。
GeoAI 对实现这两大能力至关重要:
• 为丰富 KnowWhereGraph 的“地理”知识,GeoAI——尤其是地理知识引导的大型语言模型——被用来从自然语言文本及其他数据源中高精度抽取地理实体及其空间关系。与一般信息抽取不同,GeoAI 需指导大模型识别地理实体的独特特征,并创新性地整合多源信息(如地名词典)以消歧地名等地理知识。
• GeoAI 也用于图嵌入:将实体类型、几何信息及空间关系编码进知识图谱,进一步丰富知识表征(Hu et al., 2025)。
这种高度互联、位置感知的知识图谱,已成为 NASA 关键应用领域——灾害备灾与应急响应——的宝贵知识库。通过图 3 所示的新型地理可视化前端,图谱数据帮助利益相关者快速建立对受灾区域、受损程度及连锁事件的态势感知;同时揭示社会经济与健康画像,使救援专家能够识别脆弱社区并支持疏散行动。更进一步,GeoAI 还可推断二阶、三阶影响,回答“假设”类问题,识别不同行动方案下可能需要的减灾与救生措施。
图 3 展示了 GeoAI 与知识图谱驱动的决策工具 GeoGraphVis(Li et al., 2023)在灾害响应中的应用示例。界面中央的地图以 Hurricane Harvey 受灾区域为焦点,实时呈现了各地区的无保险覆盖率(uninsured rate)。用户还可单独或叠加查看其他灾损信息及健康相关因子,从而快速形成对受灾区域的多维态势感知,为救援与资源调配提供精准支持。 上文介绍的两个项目代表了 GeoAI 发挥关键作用的两大研究分支:北极项目把 AI 在图像分析、计算机视觉上的能力拓展到多年冻土大数据生成;知识图谱项目则把 AI 在自然语言处理上的威力延伸到跨(地理)领域信息整合与空间推理,以回答关键决策问题。尽管进展令人振奋,GeoAI 仍面临诸多挑战,需要持续研究才能突破科学瓶颈、回应社会需求。除了 AI 本身众所周知的局限——可解释性、伦理与责任、开放 AI——我还想强调 GeoAI 在地球科学中的几项关键议题。
3.1 GeoAI 建模成果的系统科学验证 GeoAI 能在前所未有的尺度与分辨率下处理海量观测数据并产出科学数据产品,但针对这些产品的严格科学验证仍显不足。例如,PDG 团队首次生成了 5 TB 的泛北极冰楔多边形(IWP)数据集,通过对超高分辨率卫星影像做分割完成(Udawalpola et al., 2021)。该数据集对评估与多年冻土融化直接相关的地下冰状况极有价值。
从 GeoAI 研究角度看,评估通常用未参与训练的 IWP 标注样本来计算性能指标。然而,从科学分析角度看,还需在北极多样地貌中,用地面真值做系统验证。问题在于,这种地面真值采集往往需要大规模野外或人工工作,难以实现;且野外数据与卫星影像的采集年份常不一致,易产生差异。要让 GeoAI 数据在后续科学研究中真正可信,地球科学界与信息学界必须携手建立系统化的评估框架。只有构建稳健的验证方法,才能弥合 AI 结果与现实世界科学适用性之间的鸿沟。
3.2 面向地球科学的可复现 GeoAI “可复现的地球科学”并非新话题,学界早已认识到开放科学——共享数据、方法与成果——对持续创新的重要性。然而,GeoAI 模型结构复杂,涉及数据细节、模型参数、训练微调、评估方式等众多环节,使得计算层面的复现极具挑战(Reinecke et al., 2022)。同时,GeoAI 的学习曲线陡峭,尤其在气候预测等复杂问题上,对科学界构成门槛。
为此,需要新的方法来记录、测试并确保 GeoAI 模型能顺利配置与运行。生成式 AI 工具(如大语言模型)有望自动化生成文档并进行复现测试。设想一个“自主复现代理”,承担双重角色:
1. 从现有代码自动生成文档,并通过与模型开发者的自然语言交互澄清细节;
2. 充当测试代理,依据文档验证模型能否成功部署并复现预期结果。
通过“迭代—再测试”的代理范式,可显著减少人力投入,提升 GeoAI 模型的计算可复现性。
比计算复现更难的是可复制性,或更确切地说,是 GeoAI 模型的泛化能力(Goodchild & Li, 2021)。在某个地理区域训练的模型,因空间异质性,在另一区域可能给出不同预测结果。Goodchild 与 Li 将这种现象称为地理研究“弱可复制性”。正因如此,计算复现——在相同数据、相同模型、相同研究区下得到一致结果——显得尤为关键。当研究者迁移已有 GeoAI 模型时,必须首先确保在完全一致的设置下能复现原结果;同时应清晰说明研究的假设、约束与情境边界,使他人能准确理解并恰当解读结果。
3.3 生成式与确定性 AI 在地球科学中的融合 迄今为止,GeoAI 在地球科学中的应用大多聚焦于“确定性”任务:从 EO 数据中提取已有信息。第二节介绍的两大项目——卫星影像分析和半结构/自然语言数据中语义信息抽取——均属于此类。近年来,生成式 AI 的兴起为 GeoAI 带来全新可能。与确定性任务不同,生成式 AI 能够创造新内容(图像、视频、文本、自然语言回答等)。这至少可在三方面推动地球科学 GeoAI:
1. 自动生成具有期望方差和分布的训练图像,提升影像分析模型的性能;
2. 自动化科学工作流生成——地球科学信息学研究者长期致力的方向(Fox et al., 2009);
3. 借助生成式 AI 的意图理解能力,再与确定性 GeoAI(如排序)结合,实现跨数据中心(如 GES DISC;Leptoukh et al., 2002)的地球数据产品语义搜索。
然而,生成式 AI 也是一把双刃剑:其输出可能“编造”答案,而确定性任务的结果直接源于现有数据。为降低风险,可通过多种交叉验证策略:
• 多模态数据输入;
• 独立开发的工作流;
• 生成式与确定性并行的多元求解框架。
生成式与确定性 GeoAI 的融合,有望带来更自动化、更智能的地球科学问题解决方案。 |