DeepMind 的Peter Battaglia解释了AI如何重塑气象科学

Callen · 发表于 2026-1-13 10:17:44

转自：https://mp.weixin.qq.com/s/UcqOQ5Pnr2VcBBV1POPfDQ
原创 Latitude AI+能站 2026年1月4日

人工智能究竟是如何应用于天气预报的？它又是如何真正带来改进的？Latitude Media采访了谷歌 DeepMind 可持续发展项目研究高级总监彼得·巴塔利亚（Peter Battaglia）。2025年11月，该团队发布了一款全新的人工智能天气预报模型。他们探讨了以下话题：

为什么降水比温度更难预测
气象行业的运作方式：政府机构建立全球模型，私营公司则针对特定应用场景进行精细化处理
人工智能模型能看到哪些传统超级计算机模拟看不到的信息
手机、门铃乃至社交媒体等新型数据来源

我是 Shayle Kann，目前在 Energy Impact Partners 负责早期投资业务。欢迎收听本期节目。下面这句话我相信大家都会认同：AI 将改善天气预报。这看起来显而易见，对吧？如果在听到今天的对话之前有人问我，我也会毫不犹豫地同意。但真正让我感兴趣的问题是：为什么？AI 究竟是通过什么机制来提升天气预报的？更重要的是，我们今天究竟是如何做天气预报的？如果预报真的变得更好了，又会带来哪些实际影响？

对我来说，这个问题之所以重要，有两个原因。首先，天气预报本身对许多我关心的领域至关重要——不仅是气候韧性，还包括能源、农业等。其次，我认为天气预报是 AI 下一波应用浪潮的一个典型代表。

大语言模型正在渗透所有涉及语言的领域；世界模型也开始出现，试图革新机器人技术及物理世界的其他方面。那么像天气这样的领域呢？虽然我们过去也使用过一些机器学习方法，但现在是否能借助 Transformer 等新架构取得更大突破？让我们一探究竟。

今天的嘉宾是彼得·巴塔利亚，他是谷歌 DeepMind 的研究高级总监，正利用 DeepMind 强大的“大脑”来改进天气预报。欢迎你，彼得！

彼得·巴塔利亚：谢谢。很高兴来到这里。

沙伊尔·坎：好的。我们来聊聊天气预报。我想也许可以请你先给我科普一下我意识到自己不知道的东西：我们目前是如何进行天气预报的，也许还有一点历史。历史上，在天气预报方式上是否出现过重大的技术变革？所以，也许你可以带我回顾一下天气预报的历史，然后讲讲我们今天到底是怎么做的？

彼得·巴塔利亚：好的。我得承认，我自己也是天气预报领域的新手。我们是几年前开始涉足这个领域的，它源自一个旨在模拟复杂仿真（包括流体）的研究项目。地球大气就是一种流体。我们当时有兴趣探索的一大挑战就是模拟大气流体，也就是天气预报。所以我得说，我自己也经历了学习天气预报的过程。我要说的内容，希望是准确的，但如果我说错了请见谅。根据我的理解，这个领域……历史上，天气预报对于农业和其他对日常生活非常重要的应用场景非常重要。但我认为大约在100到150年前，开始有机构或部门开始进行海洋天气预报或更系统化地收集观测数据，并将其视为一门科学。

但大概在50年前左右，大型政府公共气象机构开始出现。我认为美国国家海洋和大气管理局是在70年代成立的。欧洲中期天气预报中心也是在70年代成立的。这是两个主要的著名气象局，但大多数政府都有气象局，而且传统上天气被视为公共产品。所以他们会收取税款，然后资助他们的气象服务。这个想法是，不仅预测天气有用——比如决定是否带伞或穿外套——对于即将到来的危险风暴、洪水、极端高温、极端寒冷等情况，以及农业、能源、交通等很多决策也至关重要。

总的来说，传统上人们认为天气预报是一项投资回报率很高的项目。因此，投资于国家气象局的公共税收在这些投资上能获得显著的经济回报。我想，这大概是我对标准化或官方天气预报业务历史的理解。关于如何看待这个行业，我还可以补充一点：在我看来，天气预报行业可以分成……几乎像一个管道。一方面有政府官方气象局发布这些全球预报，预测各种天气变量，但通常空间分辨率比较粗。然后有一个庞大的后处理链，他们拿着基础预报，再为不同应用场景进行专业化处理。

例如，当你查看手机上的天气应用，看到降水概率时，那并非直接来自NOAA，而是来自其他中介机构，他们利用本地气象站数据和其他历史信息，试图调整和改进预报，使其对你的特定用途特别有用。在能源和其他各种天气预报应用中都能看到这种模式。

沙伊尔·坎：这历史上运作的模式与今天大语言模型的情况有可比性吗？我不是要过早跳入AI话题，但我的意思是，全球预报，比如NOAA的预报，那是否是一个吐出单一大型预测的大型巨型模型？然后，后处理领域的人们所做的就是：好吧，我拿这个模型，然后分叉它（用词可能不当），但我要分叉它并加入一堆额外数据，试图在更小的空间分辨率上做得更好。我只是想描绘一下实际的情况。

彼得·巴塔利亚：是的。我的意思是，我还没怎么从技术角度说实际的天气预报是如何产生的。也许我解释一下，就能回答这个问题了。再说一次，流体，大气就是一种流体。在物理学中，我们有称为纳维-斯托克斯方程的流体方程，它们支配着从宇宙最大尺度结构（实际上也是一种流体）到血液流动的所有尺度流体。湍流决定了血液如何流动，并有重要影响。中间的一切事物，比如天气、溪流等，也都是流体。工程师们发现，流体模拟非常复杂。为了准确模拟，他们需要近似求解方程，以便在大型计算机上运行，因为它们太复杂了，无法直接在计算机上原生运行。

为了实际模拟大气中发生的一切，你必须分解计算并近似某些东西。这叫做数值天气预报。"数值"就是指他们对纳维-斯托克斯方程进行数值近似。传统上，这都是在超级计算机上运行的。许多大型超级计算中心要么大量进行天气预报，甚至是专为天气预报而建的。在许多方面，这是科学和工程学的一项胜利，使得我们能够十年又十年地预测未来不是一天、两天，而是10、12、15天。这甚至很难想象，这种预测精度的规模在一百年前是不可想象的。人们根本没想到两周后我们能知道天气会怎样。

这很疯狂。这依赖于知道地球另一端正在发生什么，因为盛行风携带着水汽、温度等等一切。

沙伊尔·坎：我猜，预测时间越远，复杂性呈指数级增加，因为今天实际发生的情况有多种可能性，而每一种都需要在预测明天乃至未来时考虑进去。

彼得·巴塔利亚：这就是蝴蝶效应，对吧？一只蝴蝶可能扇动翅膀也可能不扇，这将决定一周后是否会有飓风。所以，微小的变化或缺失的效应，可能会随着时间的推移在天气上产生巨大变化。完全正确。大气流体被认为是混沌的，这正是混沌的定义：微小的变化可能在后期产生巨大影响。这就是天气预报如此困难的原因。而且尺度之间存在耦合。同样，蝴蝶扇动翅膀，但大气顶层也在发生各种事情。这正是为什么精确求解支配大气流体的方程非常困难。因此，我们必须进行近似，并使用超级计算机以及各种技巧。

我还应该指出另一个重要认识：当天气预报生成时，对未来进行预测只是整个过程的后半部分。前半部分是弄清楚当前的天气状况。我们有卫星、气象站、气球、船只等各种信息源在测量地球各地的天气。但再次以蝴蝶为例，原则上你需要知道每只蝴蝶的位置才能完美预测天气。仔细想想就会发现……天气预报在某种程度上总是存在根本的不确定性。我们永远无法精确观测地球上每个地方的天气，达到完美预测一周后天气所需的精度。

Callen · 发表于 2026-1-13 10:19:06

（接上篇）

因此，在天气预报中，这就是为什么会有"降水概率"而不是"肯定会下雨"，以及为什么有一个温度范围，尤其是预测时间越远。这再次说明了天气预报为何如此困难。所以天气预报的第一步实际上不是预测，而是处理所有卫星数据、所有气象站和不同观测数据，估算整个地球当前的天气状况。一旦有了这个估算，我们才能用超级计算机进行预测。我们的团队以及该领域许多致力于基于AI的天气预报的团队，尤其关注这第二部分。但我猜测，随着时间的推移，我们将会看到天气预报过程的其他部分也引入越来越多的AI方法来试图推进它们。

沙伊尔·坎：在我们深入AI方法之前，似乎总体而言，即使在AI之前，我们一直在……我的意思是，你来告诉我曲线是线性的、指数的还是平的，但看起来几十年来我们预报天气的能力一直在提高，我不知道，似乎是相当线性的改进。我们预测得更精确，也正如你所说，能预测得更远，比如一周、两周等。如果这是真的，我相信是所有因素共同作用的结果，但我们历史上看到的改进有多少来自，比如说，A) 如你所说，拥有关于当前天气状况的更好的"真实"数据；B) 更强的计算能力，如你所说，一直在超级计算机上运行。所以我们拥有越来越强大的计算机，可以运行越来越复杂的纳维-斯托克斯方程；或者C) 额外的技巧，基本上就是让你在不增加计算量的情况下做出更好的预测。

彼得·巴塔利亚：是的，这是个好问题。我得承认，我不知道确切答案。我想三者都有贡献。关于第一点数据，是的，有更好的卫星在运行，有更好的系统收集气球观测等不同信息。所以我们肯定获得了更好的数据，我们知道这提高了预报质量。我们也有更好的模型。这肯定也是对的。我们正在建造更大的超级计算机。它们能以更精细的分辨率运行。我认为就在过去不到10年里，拥有最佳天气预报的ECMWF提高了分辨率，意味着他们的预报在空间上有更精细的细节，这使得预报更准确。所以，你看到了增加原始计算能力，以及提高模型质量和近似方法都产生了相当显著的影响。

我认为这与你提到的第三类其他技巧有所重叠。总的来说，在不深入数值模型工作原理细节的情况下，你可以将它们看作一个主干，在核心尺度上做出一般性预测。然后，在幕后有很多参数化和其他技巧，做出越来越精细的预测，并更新主干模型以与精细尺度保持一致。所有这些都在并行推进。这些工程团队和科学团队正在共同努力改进它们。最后我还想说，回到天气预报流程的后处理部分，改进并不仅仅来自NOAA、ECMWF这些大型机构自身预测的改善，下游后处理的其他部分也在改进他们所做的事情。

实际上，AI和机器学习在天气预报中的首次应用，或者至少是最早的一些应用，并非试图彻底改革整个天气预报过程本身，而是使用越来越多的统计方法、线性回归、非线性回归、神经网络以及更早期的机器学习技术来改进——不是基础预报，而是具体应用。例如，如果我们有一个稍好一些的下游模型，也许能更好地校准你的降水概率。

沙伊尔·坎：所以，好的。我们一直在改进，近年来一直应用早期版本的ML来持续改进。我很好奇从你的角度来看，最大的差距是什么。显然，我们今天还没有能力生成完美的三个月后的预报。总可以变得更好，但除了这个因素，你觉得有没有哪个领域确实很难做到X？比如降水是个难题，还是别的什么？

彼得·巴塔利亚：是的。我想可以从两个角度回答这个问题。你总是会受到数据质量的限制。所以，如果你对某事没有好的数据，就是垃圾进，垃圾出。这些模型基于对当前天气状况的估计来预测将要发生的事情。如果你的估计因为原始观测不好而不准确，你就不会得到很好的预报。所以，改进数据收集并利用已收集的数据形成对当前天气的更好估计，这肯定总是能改善状况。所以这是一个已知的差距，对吧？我们不知道天花板具体在哪里。我们不知道如果增加某个卫星或地面站观测会如何改善情况。我们可能有个想法，但并不总是知道，有时必须进行测试。

但我想说的另一点是，天气的不同特征预测难度不同。一个明显的例子是温度。温度变化相对平缓。如果你看一张全球温度地图，除了山上会冷一些，山谷会不同，但总体是平滑变化的。但降水就不平滑变化。比如一场突如其来的猛烈雷暴，伴有狂风、低压等，锋面具体在哪里，降水具体发生在哪里，风和这些现象的具体情况要困难得多，因为一切都发生在更精细的尺度上。

即使你看雷达图也能看到这一点。降水在地球上并非平滑变化。你会看到这里有一小片雷暴，或者这里有雨，几英里外却什么都没有。因此，这类非常高分辨率、复杂模式的降水（风也是如此）预测起来要困难得多，因为你实际上在预测多得多的信息。你不能简单地概括说"哦，每25公里温度是这样，其他就插值一下"。有很多事情发生在比我们许多模型甚至能捕捉到的更精细的尺度上，然后我们必须采取次级步骤来试图解析这些更精细的细节。

沙伊尔·坎：好的。那么我们来谈谈AI。你提到了这一点，对吧？每当我们谈到AI（加上引号）应用于这里，机器学习作为AI的一个子集是相关的存在。我们已经做了机器学习。所以我想问的第一个问题是，当你现在和未来考虑利用AI进行天气预报时，我们说的是哪种AI？比如，是哪个版本或哪些版本？你实际上在……这里有趣的实际能力和/或模型结构是什么？

彼得·巴塔利亚：是的，这是个好问题。如今，AI是个相当随意的术语。我发现我自己也只用AI这个词来指代很多不同的东西，因为我觉得这样更简单，通常人们也明白。但我的理解是，AI和机器学习的区别在于，机器学习更像是AI的统计内核。它试图通过训练过程获取数据并捕捉模式，然后基于一种归纳假设，即"过去看到的与未来将要看到的相似"。现代AI我认为是一个更广泛的家族。它包括智能体、与它们的互动，以及很多语言模型也常与AI关联。我们在天气预报模型中使用的，以及这个领域许多人在推进、发展基于AI的天气预报时所使用的，大多仍然是相当传统的机器学习——监督学习。

监督学习意味着你取一个包含成对样本的数据集，一个输入样本和一个目标样本，然后训练一个模型尝试从输入样本准确预测目标样本。所以，如果你把天气看作——就像我之前说的——你先估算当前天气状况，下一步是预测接下来会发生什么。

监督学习方法可以训练来做这件事。这就是我们模型以及我所看到的大多数人正在做的。然后唯一的额外步骤是，它只做一次预测，但我们把模型的输出再反馈给它自己，然后让它做另一个预测。所以输出变成输入，然后它生成另一个输出。如果你把这些步骤链式连接起来，你得到第一个输入，然后得到一系列代表未来时间步的输出。所以我们使用监督学习。在AI架构方面，如今我们使用Transformer和图神经网络。人们也使用卷积神经网络，但我认为如今神经网络架构本身往往不是最令人兴奋的部分。通常是训练、数据处理方式等方面更令人兴奋。

Callen · 发表于 2026-1-13 10:20:23

（接上篇）

沙伊尔·坎：但你提到了Transformer，因为我想如果我们五年前进行这次对话，你大概还是会告诉我关于监督学习的事，对吧？那并不新。Transformer当时已经发明，但还没有像今天这样广泛应用。那么，由Transformer、卷积神经网络等开启的这波新AI浪潮，相比五年前，能让你做到哪些超越呢？

彼得·巴塔利亚：是的，这是个好问题。我是这样看的。Transformer与图神经网络非常相似。两者都……实际上，我们先退一步。过去我们经常使用卷积神经网络。其思想是，它学习一个在图像中局部的小函数，然后在所有地方应用同样的函数，接着堆叠这些层，最终让图像一侧的信息能与另一侧的信息交流，因为它是一个层次结构。Transformer架构则允许你在图像一侧和另一侧的信息之间建立直接连接，图神经网络也是如此。我喜欢用图神经网络来类比思考，因为它的意思是：在图中，你有节点，节点之间有边或连接。节点之间较长的连接对应较远的节点，较短的连接对应较近的节点。

所以，如果用图神经网络的类比来描述旧的卷积网络，那就好像图都很小。一切都很近，就像图像中的邻近区域。图神经网络允许你选择信息交互的远近。而在Transformer中，它可以被理解为一个具有跨任何空间尺度连接性的图。在语言模型中，Transformer的工作原理是：当我想预测下一个词时，我希望被最近的词告知，也被文本中之前出现的每一个词告知。这很重要，因为在语言中，下一个词不仅仅由前一个词预测，实际上也由句子、段落或书中更早的内容预测。因此，拥有跨越大空间尺度并能相互交互的信息的能力，这种能力让你……它开启了新的计算模式，允许你表示传统上难以表示的函数，但它能让你更好地预测下一个词，或者……在我们的例子中，你可以把它看作是预测下一个空间点或远处的空间点。这使得模型更加灵活，能捕捉更丰富的函数。

沙伊尔·坎：这里有个很好的比较。你认为……你刚才描述的，在天气预报中借助Transformer架构能做到的事情，与大多数人最熟悉的这波新AI浪潮中的大语言模型能做到的事情有相似之处。那么不同之处是什么？

彼得·巴塔利亚：这是个很好的问题。我认为有趣的是……在语言中，文本被理解并视为一个序列。词元、词元、词元。我们在天气中也建模序列，但我们不让我们的模型回溯太远的时间。因为天气从根本上与文本不同。事实上，大多数物理过程都是如此。它们是所谓的"马尔可夫"过程，即系统的最远状态决定了后续状态。正如我所说，在文本中，情况并非如此。我暂停一下……你并不知道我下一个会说什么词，对吧？这取决于更早的上下文，一大堆词。原则上，对于天气预报，如果你确切知道现在正在发生什么，你就能完全预测接下来会发生什么。你不需要回顾更远的过去。

所以我们实际上使用Transformer不是为了建模天气随时间（像文本序列那样）的相互作用，而是建模空间上的相互作用。在文本中，你实际上没有空间结构感，对吧？你只有一个文本序列。词、词、词。当你阅读时，你只看到词、词、词。在天气中，你有空间结构，整个地球在同一时间都有天气。特别是附近的天气，它决定并可以用来预测我们当前位置接下来会发生什么。所以我们使用Transformer和图神经网络来捕捉短期和长期的空间依赖关系。这些附近与即将发生之事之间的相互作用决定了天气，我们就是这样做出这些预测的。

但我还应该补充一点，类似于我早些时候说的，不可能测量地球上正在发生的一切以及天气的精细细节，你必须进行近似。这些模型也一样。这实际上引出了AI模型与传统模型进行预测方式的一个根本区别。AI模型可以利用天气模式的统计结构。例如，如果我观察一个在地球上移动的飓风，对吧？在传统模型中，它模拟的方式是极其精细的，它需要弄清楚气压、温度、风、湿度等等是什么，以及这些东西下一步会发生什么，这严格由局部决定。而AI模型，因为它们能看到更大的空间范围，它们可以使用传统方法所用的方式，也可以使用其他方法。

因为当你观察飓风时，它几乎就像一个在球体上滑动的物体，对吧？传统模型并不是这样建模的。我们并不完全理解AI模型是如何预测它的，但它们确实能够将飓风几乎视为一个移动的大型宏观物体，因为它们能看到飓风的整个结构，也能看到近期过去发生了什么。

沙伊尔·坎：它们具备旧模型所没有的空间感知能力。

彼得·巴塔利亚：是的。我们不知道。我想说，在理解AI如何工作、确切理解它们在这个意义上如何"看"世界这一科学领域，这真是一个非常有趣的方面。

沙伊尔·坎：在我看来，一方面，这比大语言模型要难得多，因为你面对的是整个物理世界，数据稀疏如你所说，而且有很多复杂的相互作用。另一方面，它具有确定性，而语言模型则没有，对吧？不一定有唯一正确的下一个词。对，只是一个关于最佳下一个词的最佳猜测。但在天气预报的情况下，存在一个正确的预测。并且有大量的历史数据可以用来做这件事。所以我在来回思考，这个问题是比做一个非常好的大语言模型更难还是更容易。

彼得·巴塔利亚：我想这取决于你的立场，可能更偏向一个观点问题，但没错，我认为你完全正确。我换种说法：就像我之前说的，从模型可获得的信息角度来看，它仍然从根本上具有不确定性。是的，底层的物理确实是确定性的，但因为模型看不到蝴蝶，看不到精细尺度的东西，从它的角度来看，这实际上是一个随机过程。因为如果它不知道蝴蝶是否扇动了翅膀，它怎么能知道飓风是否形成呢？所以，从模型可获得的信息角度来看，在某种程度上，它也是一个不确定的随机过程。但是，是的，我认为你刚才说的完全正确。

我认为文本的底层结构以不同的方式具有随机性。例如，我停顿一下，然后说一个词：家具。天气不是这样工作的。它不会凭空冒出一些与历史记录完全不同的东西，就像你指出的那样。所以我认为天气中不确定性的结构是不同的，它在某种程度上更受约束。在文本中，你可以想象，看一部电影，有人要进门。你完全不知道他们会穿什么颜色的衬衫。可能是蓝色、红色，任何颜色。无法预测。而天气，你总是能有一些想法，只是不知道精细细节。另一方面，天气是一个极其复杂的过程。这种混沌的流体系统，从小尺度到大尺度都有相互作用，并且同时在整个地球上发生。所以在某种意义上，你不是在预测下一个词，而是在同时预测数百万个变量。

所以我认为，这大概更适合和朋友在酒吧里，和他们在LLM实验室的朋友辩论，而不是仅仅基于这些事就能裁定。

Callen · 发表于 2026-1-13 10:21:56

（接上篇）

沙伊尔·坎：我想关于与大语言模型世界的比较，还有另一个问题。众所周知，大型语言模型是在互联网上训练的。你的训练数据集就是互联网上的所有文字。这也是它们成为这波新AI浪潮中首批主要商业化模型的原因之一，因为有庞大的训练数据可供利用。现在我们听说许多从事机器人等领域的人面临挑战，因为没有同等规模的数据集。你可以尝试用YouTube视频之类的训练，但不太一样。在天气预报方面，在我看来，理论上你有惊人的历史数据……可以查看每一个历史天气测量值。如果你能获取那些数据，如果NOAA拥有历史上每一个他们曾记录的输入数据点，以及随后的下一个测量值（它决定了之后发生的事情），我认为这将是一个极其丰富的训练数据集。两个问题：我这么想对吗？这些数据实际可用吗？

彼得·巴塔利亚：是的，这些都是好问题。首先我想说，实际上不仅是语言。第一个大型视觉神经网络是在ImageNet这个大型图像数据库之后出现的。第一个语言模型，甚至在十年前，人们就开始构建大型文本数据库。蛋白质折叠，有大型蛋白质数据库。实际上，你看到AI和机器学习仍然对高质量、大量数据的可获得性非常非常敏感。推进该领域的最好方法之一就是收集高质量数据并将其标准化和可用。

对于天气，我认为有好的方面，也有坏的方面。好的方面是，当我们开始时非常幸运。我认为所有从事AI天气预报的人都极大地受益于ECMWF（欧洲中期天气预报中心）所做的工作。他们构建了一个名为ERA5的数据集，他们一直在构建……ERA5是ERA数据集的第五代。这是一个长达数十年的地球天气记录。我认为最初发布的数据追溯到1979年，然后他们实际上又扩展到了60年代。他们设计这个数据集的本意并非支持机器学习，更多是为了拥有一个关于地球上年复一年气候的权威记录。它的时间分辨率是6小时，空间分辨率是25公里。所以非常丰富。它恰好非常适合机器学习的天气应用。这是一个整理得非常好的数据集。ECMWF的工作人员非常出色，有条理且系统化，他们开放了这个数据集，使得许多人能够站在巨人的肩膀上，构建出优秀的新AI方法。

但有一件事是，因为我们过去使用不同的卫星和不同的气象站，所以它并非全部……数据集是标准化的，但并非源自相同的底层观测。所以时间越往回推，质量实际上就越差，因为正如我之前所说，输入数据没有那么好。另外，天气数据的一个不太理想之处是，天气的发生需要时间。所以我们必须等待更多的天气数据，等待更多的天气发生来获得更多数据。目前我们拥有的天气数据，基本上就这些了。明天我们会多一天的天气数据，但我们的模型是以6小时为步长的，所以只能等待。你有点像是：我们有很多数据，但同时，要获得更多同类数据的空间不大。我和许多其他人现在正在寻找更多不寻常或尚未充分探索的数据源，以支持构建更丰富、更好的模型。

沙伊尔·坎：是的。有没有分布式网络数据……理论上，如果你能获取，比如说，每个人的手机，每个人的iPhone，iPhone里可能有很多传感器。大概你可以从中提取一些对你有用的信号。

彼得·巴塔利亚：是的，是的。你可以对这些东西着迷。我最喜欢的一个例子是：我有一个视频门铃。它整天坐在那里观察天气。汽车，你的车，对吧？里面有温度计，有雨刷。有些现在可以感应下雨，或者天黑时自动亮灯。所以它们能感知是否多云等等。我对利用所有这些可能性感到非常兴奋。另一个更奇怪的是，人们在推特上谈论天气。他们在社交媒体上谈论天气，这类观测仍然是观测。我们不知道它们质量如何，但实际上有非常多不同寻常、未被充分探索的数据源。但即使在这些之前，我认为可以考虑很多公司正在尝试建造非常廉价的气象站。人们可以把它放在屋顶上。这些东西确实有助于核心天气预报，也可能有助于人们想要使用天气数据的许多应用。

沙伊尔·坎：我从这一点得到的启示是，尽管我提到过存在这个惊人的、包含所有曾经记录过的天气测量值的历史记录，但你仍然感觉数据贫乏，或者说训练数据贫乏。

彼得·巴塔利亚：你总是数据贫乏，对吧？现代AI的故事就是你基本上总是数据贫乏，因为现代AI最令人难以置信的事实之一就是它随着数据规模的扩展能力有多强。更多数据就意味着更好的模型。我曾是一个对此非常怀疑的人，我不认为它会这样扩展，并会提出我的逻辑论证，但事实证明我错了。我想很多人都错了，而那些真正理解数据即使在极大规模下也能增加价值的人是正确的，他们沿着这条路走，并带来了我们今天所处的局面。

沙伊尔·坎：有意思。好的。所以我想最后谈谈未来可能的发展。如果你展望未来几年，我知道你选个时间，三年、五年、十年，随便，如果你和所有从事AI天气预报的人都成功了，我们可能会达到什么程度？几年后哪些今天不可能的事情会成为可能？

彼得·巴塔利亚：是的。我的意思是，天气影响一切，对不同事物影响不同。能源显然对天气非常敏感。有些事物只受天气的微弱影响。所以我希望看到并且觉得非常令人兴奋的一件事，是天气更广泛的应用场景。例如，我们知道人们会根据对天气的预期，做出不同的选择，比如在冰箱里放什么、穿什么衣服、是否旅行等等。我认为你可以基于更准确的天气预报，开始为人们提供更细致和知情的指导和建议。这是在消费者层面。但我认为在行业层面，也可能存在巨大机遇。比如在能源领域，我们看到，如果你有一个风电场或太阳能电站，你会根据天气预报来预测，然后用来决定你是否有能源可出售以及如何定价。

但我有种感觉，在规划电网如何运行、预测电力需求方面，还有很多改进空间。天气会热吗？会冷吗？湿度会高吗？空气是否携带更多质量，从而需要更多能量来加热或冷却？我认为我们甚至还没有触及这些机会的表面。我认为供应链、物流，甚至驾驶等许多选择，都可以通过更好的天气预报获得更好的信息支持。我认为我们甚至还没有开始涉足这些。我们需要看到预报质量变得更好，并更针对这些应用场景定制，才能开始释放这些潜力。

另一个显然更好的就是危机处理。我们最近在热带气旋预报方面的工作，我感到非常自豪。我们希望，通过更好的预报，我们可以更早、更准确地警告人们。在某些灾难如野火的情况下，也许我们甚至可以介入，试图在它完全失控之前阻止它。所以，这同样不是我们今天能做到的，但我非常乐观……总的来说，也许这已经体现了，但我的团队和我真的相信技术的力量可以带来很多积极效益。所以我们经常寻找方法，让技术得到最佳利用，为我们的孩子们留下一个比我们成长的世界更美好的世界。

沙伊尔·坎：好的，彼得，这次谈话非常有趣，对我思考天气预报的背景，以及理解AI如何在各个行业应用、面临的挑战和机遇方面都非常有帮助。非常感谢你的时间。

彼得·巴塔利亚：当然。是的，来这里也很棒，顺便说一句，你的问题提得也很好。真的很有趣。

（完）