第一篇概要
摘要
卫星降水估算在气候变化评估和水资源管理中扮演着至关重要的角色,得益于其广泛的覆盖范围。然而,卫星降水产品的系统性偏差和随机误差限制了其应用,使得采用基于雨量计观测的校正方法成为提高降水估算精度的必要手段。尽管校正方法有效,但它们仅限于有雨量计的区域,对于雨量稀疏或无雨量计的区域存在挑战。为了解决这些局限性,我们提出了一种新颖的无监督自适应融合框架,通过自适应融合网络以无监督的方式融合多源卫星降水数据。具体而言,所提出的框架采用无监督优化方法来优化网络参数,利用无监督学习的方式,无需地面雨量计观测数据。自适应融合模块旨在动态选择来自不同降水数据的最具信息量的特征,确保卫星降水数据的最优融合。通过2015至2019年间中国的降水数据进行的实验表明,所提出的框架显著改善了卫星降水数据的质量。融合后的降水产品在空间精度上得到提升,并与雨量计观测结果的一致性更好,超越了原始产品的性能,甚至达到了雨量计校正产品的质量水平。该框架在没有雨量计观测的情况下改进了降水估算,为无雨量计区域的气候与水资源管理提供了宝贵的参考。
所提出的无监督自适应融合框架如图2所示。该框架由三个主要部分组成:初始特征提取、自适应融合和无监督优化。首先,采用“自上而下”和“自下而上”方法获得的降水产品被输入到增强特征提取模块(EFEM)中,该模块从输入的降水数据中提取初始特征。接下来,设计了一个自适应融合模块,用于融合来自不同分支的初始特征。融合过程旨在充分整合原始降水产品中的关键信息。然后,融合后的特征图通过EFEM进行重建,得到最终的降水产品。在训练阶段,网络参数通过迭代最小化最终输出与原始降水产品之间的损失,以无监督优化方式进行更新。所提出的框架能够在没有雨量计观测的情况下生成高质量的降水产品。为了评估框架的性能,我们通过将结果与地面雨量计观测数据进行比较进行评估。接下来的章节将详细介绍该框架的实现过程。
为了评估我们提出的框架的性能,我们对每个降水产品与雨量计观测值进行了比较。所比较的产品包括:
IMERG-Early_0.1:基于“自上而下”方法的降水产品,即IMERG-Early;
SM2RAIN_0.1:基于“自下而上”方法的降水产品,即SM2RAIN;
IMERG-Final_0.1:经雨量计观测修正的降水产品,即IMERG-Final;
DIVF_0.1:该产品通过双重工具变量法生成,由IMERG-Early_0.1和SM2RAIN_0.1融合而成(Wei et al., 2022, Yang et al., 2022);
CNN_fusion_0.1:该产品通过移除提出框架中的自适应融合模块生成(即常规卷积神经网络),由IMERG-Early_0.1和SM2RAIN_0.1融合而成;
Ours_fusion_0.1:该产品由提出的无监督自适应融合框架生成,融合了IMERG-Early_0.1和SM2RAIN_0.1;
SM2RAIN_UP_0.01:通过克里金插值法从SM2RAIN_0.1产品下采样生成的0.01度产品;
IMERG-Early_UP_0.01:通过克里金插值法从IMERG-Early_0.1产品下采样生成的0.01度产品;
IS_fusion_UP_0.01:该产品通过提出的框架生成,融合了SM2RAIN_UP_0.01和IMERG-Early_UP_0.01。
在推理阶段,静态网络(如常规卷积神经网络CNN)的参数是固定的,这意味着它无法根据不同的输入降水数据自动调整其模型参数。这导致了模型对降水数据适应性差,从而降低了降水估计的准确性和可靠性。基于深度学习的动态网络方法由于其自适应学习能力,在图像处理领域得到了广泛应用(Han et al., 2021,Li et al., 2019)。动态网络具有根据不同输入降水数据自适应捕捉降水表示的潜力。然而,据我们所知,动态网络尚未应用于降水估计。为了有效融合不同降水产品中固有的特征,设计了一个自适应融合模块。该模块如图4所示,包含两个操作符:融合操作符和选择操作符。融合操作符将来自不同降水产品的信息结合起来,生成全局特征描述符。选择操作符随后利用这些描述符对来自不同分支的特征图进行重新校准,并进行聚合。这两个操作符的目的是自适应地结合并重新校准不同分支的特征图。接下来将分别解释这两个操作符的具体功能。
An unsupervised adaptive fusion framework for satellite-based precipitation estimation without gauge observations
https://www.sciencedirect.com/science/article/pii/S0022169424017372#b0195
第二篇概要
摘要
全球卫星降水估算在高时空分辨率下对水文和气象应用至关重要,但仍然是一个充满挑战的任务。其中一个主要挑战是微波数据在时空上存在不连续性。我们提出了一种新颖的方法,通过基于生成对抗网络(GAN)将不完整的被动微波(PMW)降水估算与完整的红外(IR)降水估算所提供的条件信息相结合,命名为PrecipGAN。PrecipGAN将降水系统分解为内容和演变两个子空间,从而将PMW估算传播到PMW传感器轨道覆盖范围之外的区域。PrecipGAN能够巧妙地模拟降水事件的时空变化,并生成降水估算,其整体统计性能优于基准产品——全球降水测量计划(GPM)集成卫星降水产品(IMERG)未校准版本在美国大陆的表现。PrecipGAN提供了一种精确且计算高效的替代算法,可以全球范围内实现,用于生成卫星基的降水估算。
关键点
开发了一种名为PrecipGAN的深度学习模型,用于将被动微波与红外信号融合,实现无缝的降水估算。
PrecipGAN基于降水的物理过程设计,通过将其分解为内容和演变子空间。
与现有的操作卫星产品相比,PrecipGAN能够生成统计性能更优的降水估算。
本研究提出了一种基于深度学习的卫星降水估算模型(PrecipGAN)。PrecipGAN通过物理方式将被动微波(PMW)估算(时空覆盖有限但精度较高)与红外(IR)估算(时空覆盖完整但精度较低)进行融合,从而生成无缝的降水估算。为了验证PrecipGAN的有效性,模型使用2015年的MRMS雷达数据进行训练,并在2016年对整个美国本土(CONUS)进行测试。结果表明,PrecipGAN能够有效地提取降水系统的时空变形特征。在测试期间,PrecipGAN在皮尔逊相关系数(CC)(0.48)、均值误差(ME)(-0.02 mm/h)和均方根误差(RMSE)(1.69 mm/h)上表现出良好的统计性能,且优于现有的PMW-IR融合卫星产品(即IMERG未校正数据)。
总体而言,PrecipGAN为定量降水估算和数据融合提供了新的视角,以准确且高效的方式进行。PrecipGAN一旦训练完成并稳定后,其计算效率较高,适用于大规模和操作性应用。此外,PrecipGAN由于其天然适应在线学习的特性,可以灵活地接纳额外的输入数据。更宏观地看,还需要进一步努力实现PrecipGAN或其他深度学习技术在地球科学领域的全球应用。例如,对于基于补丁的算法,应合理地合并各个补丁的模拟结果,以形成具有空间连续性和一致性的完整全球地图。此外,训练完成并稳定的深度学习模型应能够自我更新,并在应对未曾见过的情况时,尤其是应对气候变化和变异时,具备泛化能力。还值得探讨如何实现无监督的PrecipGAN,避免依赖地面观测进行训练,这将大大增强其应用性。
上述技术手段的实现主要依赖于深度学习模型,特别是通过一种名为PrecipGAN的生成对抗网络(GAN)方法,将不同来源的卫星降水估算数据进行融合。具体来说,PrecipGAN结合了两种类型的降水估算数据:被动微波(PMW)估算和红外(IR)估算。以下是该技术实现的关键步骤:
数据融合:
PMW估算:虽然PMW数据在时空覆盖上有局限,但其降水估算具有较高的精度。PMW数据能够提供较为精确的降水强度,但在某些区域的缺失使得其时空覆盖受到限制。
IR估算:IR数据则具有完备的时空覆盖,可以覆盖全球范围,但其精度相对较低。IR估算主要通过热红外辐射来推测降水情况,但其对降水强度的估算精度较低。
PrecipGAN通过物理模型将这两种数据进行融合,发挥它们各自的优势,生成更为准确且无缝的降水估算结果。
生成对抗网络(GAN)模型:
生成器:生成器负责从输入的PMW和IR估算数据中生成融合后的降水估算图像。生成器通过训练学习如何将低精度的IR数据与高精度的PMW数据结合,得到一个平滑过渡的输出。
判别器:判别器用于区分生成的降水估算结果与真实的降水数据(例如,MRMS雷达数据)。它通过优化过程提高生成器生成数据的质量,使得生成的数据尽可能接近真实数据。
这两个网络在训练过程中通过对抗学习不断优化,使得最终的生成结果不仅具有较好的时空一致性,还能有效地反映降水强度。
训练与测试:
训练阶段:PrecipGAN使用2015年的MRMS雷达数据进行训练。在训练过程中,模型通过不断调整生成器和判别器的参数,使得模型能够准确地融合PMW和IR数据,最终生成高精度的降水估算。
测试阶段:经过训练的PrecipGAN模型被应用到2016年的数据上进行测试,评估其生成的降水估算的质量。通过与现有的PMW-IR融合卫星产品(如IMERG Uncal)进行比较,证明了PrecipGAN在降水估算上的优越性。
性能评估:
为了定量评估PrecipGAN的性能,使用了常见的三个评价指标:皮尔逊相关系数(CC)、均值误差(ME)和均方根误差(RMSE)。这些指标帮助衡量模型生成的降水估算与真实观测数据之间的差异。
结果显示,PrecipGAN在这些评估指标上都表现出良好的性能,且比现有的PMW-IR融合卫星产品表现更为优越。
计算效率与应用前景:
训练完成并稳定的PrecipGAN模型具有较高的计算效率,适合大规模和操作性应用。一旦训练完成,PrecipGAN能够快速生成高质量的降水估算,并且能够通过在线学习方式灵活地接纳新数据,适应不同的气候条件和变化。
通过上述步骤,PrecipGAN实现了卫星降水估算数据的高效融合,并提供了一个新的视角,用于全球范围内的降水估算和数据融合,为气象学、环境科学等领域提供了更为精准的降水预测方法。
对抗学习(Adversarial Learning)是一种通过对抗性训练机制来优化模型的学习方法,尤其常用于生成对抗网络(GANs,Generative Adversarial Networks)中。在对抗学习中,通常包含两个相互对立的模型,它们之间通过竞争来进行训练,以达到最终的优化目标。
具体来说,对抗学习通常涉及以下两个组成部分:
生成器(Generator):
生成器的目标是生成尽可能逼真的数据,通常是一些样本(如图像、文本等),目的是让这些样本看起来像真实数据。
在GAN中,生成器接受随机噪声作为输入,然后生成假数据(例如,假图片)。
判别器(Discriminator):
判别器的目标是区分数据是“真实的”还是“生成的”,即它需要判断输入的样本来自真实数据集还是由生成器生成的。
判别器根据输入的数据,输出一个概率值,表示输入样本是来自真实数据的概率。
这两个部分在对抗学习中处于对抗关系,它们通过相互对抗的过程来进行优化:
生成器的目标是不断优化其输出,使得判别器难以区分真假数据,换句话说,生成器希望自己生成的数据越来越“真实”。
判别器的目标是尽可能准确地区分真实数据和生成的数据,它希望能够识别出生成器的假数据。
在训练过程中,生成器和判别器互相“对抗”,不断提高自己的能力。生成器通过优化其参数,使得生成的数据越来越接近真实数据,而判别器则通过优化其参数,使得它更擅长区分真假数据。随着训练的进行,生成器生成的样本会越来越逼真,而判别器也会变得越来越强。
最终,当训练达到平衡时,生成器能够生成与真实数据几乎无法区分的数据,而判别器则无法准确区分生成数据和真实数据。
对抗学习不仅在图像生成领域取得了成功,也被广泛应用于其他领域,如自然语言处理、图像修复、超分辨率重建等。
PrecipGAN: Merging Microwave and Infrared Data for Satellite Precipitation Estimation Using Generative Adversarial Network
https://doi.org/10.1029/2020GL092032
第三篇概要
现有全球气候模型输出与决策者所需的分辨率之间的差距,推动了气候降尺度的持续需求。在此,我们测试了深度学习的进展在新西兰这一高度复杂地形背景下,如何超越现有统计方法对历史降水的降尺度能力。深度学习消除了在从预测场中提取时空信息时对手动特征选择的需求,但仍需解决若干关键问题。这些问题包括:网络架构的选择复杂度、针对问题量身定制的损失函数,以及输入数据在领域大小和训练数据量方面的考虑,以确保足够的样本外泛化能力。对这些问题的敏感性测试表明,采用相对简单的卷积神经网络(CNN)架构,并精心选择损失函数,可以显著超越现有基于多重线性回归与手动特征选择的统计降尺度模型。在整个区域汇总时,湿日的解释方差比例从0.35提高到0.52,均方根误差降低了超过20%,降水90百分位数的百分比偏差改善了超过25%。通过可解释的机器学习方法,我们展示了CNN能够自学习大尺度大气环境与极端局部降水事件之间的物理上合理关系。此处记录的历史表现和物理可解释性为深度学习在气候降尺度中的更广泛发展与应用提供了有力支持。
尽管深度学习消除了手动特征选择的需求,但在将CNN应用于气候降尺度问题时,仍然有几个重要的决策需要做出。例如,**需要多少训练数据、以及以何种分辨率才能学习相关特征和非线性关系?CNN架构的复杂度应达到什么程度才有效,避免过拟合?如何设计损失函数以确保极端降水事件的纳入?哪些预测变量最为重要,应该考虑哪些空间领域?**在本研究中,我们将通过CNN的开发和应用,系统地解决这些研究问题,旨在对新西兰地区的平均降水和极端降水进行降尺度。我们还将应用可解释的机器学习方法,仔细分析CNN的预测结果。例如,如果更复杂的CNN架构能够实现更高的准确度,网络到底学到了哪些关于相关物理过程的知识,使其能够实现这一点?
可解释机器学习(也称为“可解释人工智能”)解决了长期以来深度学习模型被批评为“黑箱”的问题,因为人们认为无法理解模型是如何做出预测的。为了解决这个问题,在深度学习的背景下,可解释机器学习方法尝试可视化某些位置或预测变量如何影响网络做出的决策/预测。准确且可解释的模型被强调为建立对预测结果的信任的重要因素,甚至可能导致在复杂系统中开发出新的理解。在这里,我们实现了梯度加权类激活映射(Grad-CAM),以更好地理解CNN是如何为给定位置做出特定降水预测的。具体而言,Grad-CAM识别在给定深度的网络中,输入字段中的哪些空间位置最强地支持网络在给定输出位置(例如某个城市的降水量)上的预测。Grad-CAM并不指定网络中哪个单一的预测变量/通道具有最强的影响,而是显示在聚合预测空间中最重要的空间位置。为了更好地帮助解释,我们随后训练了不同的CNN(固定架构),并使用不同子集的预测变量,以可视化它们对网络的贡献。为了限制结果的数量,我们重点关注了使用MSLP、Q850、T850作为预测字段的网络。
在类似的天气和气候应用中,还实现了显著性图和逐层相关性传播(LRP),但这两种方法在特定应用中都存在一些缺点。显著性图不一定表示重要性,而是显示当一组预测值稍微扰动时输出的变化。显著性图通常侧重于输入空间中的局部梯度,而通常需要的是更全球化的视角。LRP在天气和气候应用中具有许多有吸引力的特点,然而其缺点在于LRP仅适用于相对少量的神经网络架构,而Grad-CAM则可以更广泛地应用。
我们第一次探索了深度学习框架的潜力,以改善新西兰的降雨量下降。表现最好的CNN模型,无论是在时间变异性方面,还是在平均和极端降雨量方面,都能够优于现有的统计方法。主要研究结果如下:
•
当在整个区域进行空间汇总时,可解释的湿润日变化比例从0.35增加到0.52(图2c)。极端降雨的现有干偏从大约40%减少到15%(图2、图3)。
•
实现深度学习对极端降雨事件的改进最大(图2、图4)。就网络架构而言,最大的好处来自实现概率损失函数。改进还来自于增加卷积层和非线性激活。
•
持续提高性能的预测变量组合与物理直觉非常一致(图5)。例如,在大气环流和可用湿度场上训练的网络远远优于仅在热力学场上训练的网络。
•
增加对预测域进行采样的域大小和增加训练样本的数量通常可以提高样本外降尺度性能。对于线性模型,域大小对性能的影响较小,这表明非线性cnn更适合于跨扩展域提取复杂信息。
•
通过实现可解释机器学习技术(Grad-CAM),我们探索了CNN中的学习关系。在不同的大规模降雨驱动因素(例如大气河流和前热带气旋)的情况下,经过训练的CNN可以在预测极端降雨时针对最相关的气象特征。这表明该模型能够学习复杂的和物理上似是而非的关系。
讨论了通过深度学习进一步提高缩尺性能的途径。其中包括测试更广泛的架构,包括添加LSTM层或实现cgan,这些架构最近在降雨临近预报领域显示出前景。迁移学习是另一种有前途的方法,即在高分辨率模型模拟上对CNN进行预训练,从而大大增加训练数据的样本量。
High-resolution downscaling with interpretable deep learning: Rainfall extremes over New Zealand
https://doi.org/10.1016/j.wace.2022.100525