北美蝴蝶空间系统发育与环境因素及植物多样性相关性研究
对昆虫生物多样性及其形成因素的大规模定量评估仍未得到充分探索。在此,我们对北美蝴蝶进行了空间系统发育分析,以测试气候稳定性和温度梯 度是否塑造了它们的多样性和地方性。我们还对蝴蝶和开花植物之间的空间系统发育模式进行了首次定量比较。发现蝴蝶的生物多样性模式与开花植物显著不同,特别是在温暖的沙漠中,与开花植物相比,蝴蝶表现出不同的系统发育聚类模式,这表明两组动物在 栖息地保护方面存在差异。这些结果表明,共享的生物地理历史和营养关联并不一定保证相似的多样性结果。这项工作在保护规划中具有应用价值。
在陆地生物多样性加速下降的情况下,快速扩大昆虫生物多样性知识库并保护它的一种方法(van Klink et al.,2020)在于关注现有数 据已经密集但尚未完全整合的分支。这样的努力也为与其他谱系的直接、实证比较提供了独特的基础。蝴蝶(凤蝶科) 因充满活力以及其艳丽的 颜色成为研究人员和博物学家的理想研究群体,它们不仅是被 收集和拍摄最多的昆虫(Scoble, 1995),而且许多种类和分支的蝴蝶已经成为研究不同生态和进化过程的模型,例如贝氏和穆勒氏拟态(例如,Heliconius属的蝴蝶(Brower, 1996;Kronforst and Papa, 2015;Lewis et al., 2019)),遗传和迁移(例如,Danaus 属的蝴蝶),以及对农业系统的适应(例如,常见和广泛的卷心菜 白,Pieris rapae (Shen et al.,2016)),遗传和迁移,蝴蝶是世界自然保护联盟等保 护机构对物种濒危状态进行初步评估的少数昆虫类群之一(Bonelli et al.,2018)。
北美大约有 1900 种蝴蝶(Lotts 和 Naberhaus,2017 年),自然史和基因数据显示有近 1500 种蝴蝶。这些强大的数 据源使我们能够超越简单的多样性分类总结,例如物种丰富度,并朝着更全面的、以过程为导向的理解 多样性在大陆尺度上是如何进化结构的。尽管有这样的潜力,对蝴蝶(或任何其他昆虫类群)以及这种多 样性的驱动因素进行综合的、广泛的系统多样性分析还有待进行。甚至北美范围内对蝴蝶类群多样性的 总结也很有限(Ricketts et al.,1999;Kocher and Williams, 2000;路易斯-马丁内斯等人,2002)。
蝴蝶对气候变化很敏感(Dennis, 1993),一个基本的问题是,当前的气候和历史上北美温度和景观的变化 是如何塑造蝴蝶的系统发育多样性和地方性的。北美具有广泛的生态系统、动态的地质历史和重要的昆 虫多样性(Danks, 1994;Godfray et al.,2000)。蝴蝶分布在 14个广泛的生态区,从东部温带森林到加拿大 北部的苔原和针叶林,墨西哥南部的热带潮湿森林,以及西南的温暖和寒冷的沙漠(Lotts 和 Naberhaus, 2017)。由于长期的干旱化和造山运动导致内华达山脉的形成,整个大陆的景观在第四纪期间发生了巨大 的变化,特别是在西部,并且通过冰川的循环模式横跨大陆的北部部分(Bintanja 和 van de Wal, 2008)。
蝴蝶也严重依赖开花植物,作为成虫花蜜和幼虫食物的来源(Bronstein et al., 2006)。一个关键的问题是, 考虑到这些强烈的生态关联和共同的历史景观和气候驱动因素,蝴蝶和被子植物是否表现出和谐的广泛 生物地理模式。最近记录北美植物系统多样性的努力(Mishler et al.,2020)为蝴蝶与被子植物的直接、 定量比较提供了数据基础。最近的分析是迄今为止最全面的尝试,涵盖了整个大陆发现的 19,500 多种 植物物种(总物种超过 44,000 种)。这项研究首次在大陆尺度上直接比较了任何一组昆虫和开花植物之间 的系统发育多样性的空间模式和驱动因素。
在此,我们收集和分析了北美蝴蝶的空间系统发育多样性,并研究了它与历史气候和开花植物系统 发育多样性模式的关系。与传统的分类方法相比,系统发育方法有两个关键优势。首先,系统多样 性指标减少了对物种定义的依赖;相反,分支长度被用来计算多样性指标。其次,空间系统发育方法 引入了进化史,并允许假设检验,从而有可能评估,例如,群落之间的亲缘关系是比偶然预期的更 遥远还是更紧密。
我们应用了一套空间系统发育方法和指标,包括系统发育多样性(PD) (Faith, 1992)、系统发育地方性 (PE) (Rosauer 等,2009)和相对系统发育多样性和地方性(RPD 和 RPE)(Mishler 等人,2014)。我们还使 用了 CANAPE,它可以区分在一个地区发现的地方性类型(Mishler 等人,2014),即在导致新地方性的 近期辐射和导致范围受限群体的遗迹地方性之间,这些群体曾经更加广泛,即古地方性。虽然这些指标 现在被普遍应用,但我们在表 1 中对这里使用的指标做了一个简短的总结。我们使用这些系统发育多样性和地方性的指标来测试关于一系列潜在驱动因素和关联的假设,包括蝴蝶 和开花植物之间独特的、直接的经验比较。这些相同的技术还记录了可能不同于植物或脊椎动物群体的 多样性和地方性中心,并为保护优先级提供信息。根据最近对北美植物系统多样性的分析,我们做出了 以下预测:
1.随着时间的推移,更温暖和保持更稳定的地区将具有更高的系统发育多样性 (PD) (Rohde, 1992;Mittelbach et al.,2007)。稳定地区(无论是温暖地区还是寒冷地区)的 PD 值应该显著高于随 机地区,因为它们有最多的时间积累谱系(Cowling 和 Lombard, 2002 年),以及可能构建群落以避 免竞争的专业化(Fine, 2015 )。
2.在最稳定的地区,相对系统发育多样性(RPD)将高于预期,积累了更多存活时间长、年龄更大的谱系(Fine, 2015)。在北美,这包括大陆的东部和最南端,正如在开花植物中看到的那样。地形异质 性高和气候最不稳定的地区,如北部和西部部分地区最近的冰川消退地区,其 RPD 将显著低于预期。
3.蝴蝶在北美的系统发育地方性将与被子植物高地方性的热点相一致。新特有的热点更有可能出现 在地势起伏较高的年轻地区,而古特有的地区则更有可能出现在气候和景观更加稳定的地区。
4.大陆尺度的开花植物和蝴蝶的系统多样性模式将是一致的,因为这两个类群之间的共同进化动力 学以及潜在的景观和气候驱动因素的相似性。另一方面,蝴蝶寄主偏好的相对广度和寄主植物数 量与整体植物多样性相比可能会稀释和掩盖一致性。
结果
北美蝴蝶的种系发生
图1 一个由1437只北美蝴蝶组成的时间校准树,其中39个最深的节点(在K-Pg边界之前)显示了bootstrap支持
总共有1437种(74.6%)已知的蝴蝶物种已经拥有COI的序列数据或进行了从头测序(图1)。从头测序添加了140个物种,其中96种(68.6%)仅分布于墨西哥。
观察到的多样性和地方性的模式
观察到的物种丰富度地图(图2A和S2A)和系统发育多样性地图(图2B和S2B)都表明,主要在墨西哥的热带干湿森林中,多样性最高,而在加拿大的北极地区,多样性最低。相比之下,观察到的RPD在温带山脉西部的大部分地区、加州的地中海地区,以及北方生态系统,如北方森林和针叶林,都较低。系统发生地方性(PE;图2D和S2D)显示了与PD和RPD相同的总体纬度梯度,但包括了墨西哥温带内华达山脉和太平洋海岸山脉沿线的系统发育特征较高的地区。
空间随机化测试
我们发现了高度区域化的过度离散模式和基于PD随机分组的聚类(图3B)。所有北方、针叶林和苔原地区的PD均低于预期,提示存在系统发生聚集性。西部大部分温带地区,包括寒冷的沙漠、西海岸森林和加州地中海部分的不同生态地区,也显示出聚集性。相比之下,与无效模型相比,北美系统多样性最高的热带潮湿和干燥森林的PD或系统发育过度分散高于预期。我们还注意到,中南部半干旱草原的部分地区也表现出高于预期的系统多样性。南部、温暖沙漠和东部温带森林的PD值不显著高或低。
RPD随机化表明,北美南部地区的社区中分支长度超过模型下的预期(图4B)。这不仅包括热带地区也有半干旱高地和南部沙漠变成半干旱平原和大草原。另一方面,内华达山脉、落基山脉和山间西部的大部分地区都发现了比预期的树枝长度短的树枝。我们在东部温带森林、大平原北部和北美最北部地区没有发现显著的RPD。
在主要的温暖沙漠和东南部沿海平原以及佛罗里达州的南部亚热带部分以古地方性为主的遗址更罕见,仅在热带墨西哥的一些地区显示。
图2 多样性和地方性模式
北美蝴蝶的观察值:(A)分类丰富度,(B)系统发育多样性(PD),(C)相对系统发育多样性(RPD)和(D)系统发育地方性(PE)。没有对数缩放调色板的地图可以在图S2中查看。
系统多样性的驱动因素
年平均温度是预测PD最重要的环境变量,其次是年平均降水量和降水季节(表2)。温暖和潮湿的地区通常有最高的PD。此外,高海拔地区和季节性降水较多的地区总体上具有较高的PD,但这些影响较弱。温度是唯一一个系数估计值大于标准误的协变量(表2)。较温暖的地区更有可能有显著较高的PD。一个地区较低的RPD表明分支相对较短,可能表明最近受到的辐射较多。气候和地形驱动因素分析结果显示,在温度稳定性和降水量较高的地区,RPD较高。此外,低海拔地区的RPD较高(表2)。
蝴蝶和植物系统多样性的异同
在以蝴蝶PD作为植物PD的响应变量的简单线性模型中,蝴蝶和北美植物的PD呈现出相似的模式(r2=0.34),不一致区域显示出中等的残差空间结构。蝴蝶的PD在热带地区高于被子植物的预测,在北美西海岸则低于被子植物的预测(图6)。令人惊讶的是,蝴蝶和植物的RPD模式并不相似(r2RPD表现出较强的线性模型残差空间结构,蝴蝶的RPD远高于被子植物的RPD预测(图6)。蝴蝶和植物都表现出墨西哥南部PE值最高的模式,但总体上,北美之间的相似性相对较弱(r2=0.10)。PE线性模型的空间残差反映了该大陆南部的PD,但在该大陆的温带地区没有空间结构误差(图6)。
图3 PD差异有统计学意义
(A)被子植物和(B)北美洲蝴蝶的系统发育多样性(PD)的统计显著性。具有显著高值的地区,其类群的亲缘关系比偶然性预期的要低(蓝色),而具有显著低值的地区,其类群的亲缘关系比偶然性预期的要近(红色)。
图4 RPD差异有统计学意义
(A)被子植物和(B)蝴蝶的相对系统发育多样性(RPD)的统计显著性。蓝色区域的分支明显长于预期;红色区域的分支明显短于预期。
与被子植物相比,蝴蝶的PD显著不同,南部高于预期值,北部低于预期值(图3)。被子植物表现出强烈的模式,在北美西部RPD显著低于预期值,而在墨西哥南部和北美东部显著高RPD值(图4)。蝴蝶在墨西哥南部的热带潮湿和干燥森林中也有显著高的RPD区域,但与开花植物不同,它们在下加利福尼亚和美国西南部也表现出高RPD。此外,与被子植物不同,蝴蝶在东部温带森林中没有显示出显著较高的RPD。在北美西部大部分地区,两组的RPD均显著较低(图4)。
图5 CANAPE结果
CANAPE结果显示,(A)被子植物和(B)蝴蝶的系统发育特有中心具有统计学意义。所有着色细胞的PE均显著较高。红色细胞集中罕见短枝;蓝色细胞有浓度的罕见长枝(古特有),紫色细胞有新和古特有的混合物。
开花植物和蝴蝶表现出普遍不一致的地方性模式。虽然CANAPE对蝴蝶的研究结果也显示了佛罗里达州混合的系统发育特有性,但对不同群体的研究结果在其他方面截然不同。蝴蝶在墨西哥北部、温暖的沙漠和西南较冷的沙漠的部分地区表现出强烈的混合地方性模式,在西部沿海地区主要是新地方性,在墨西哥南部则表现出有限的古地方性(图5)。
讨论
我们提出了第一个大陆尺度的蝴蝶系统多样性分析。该分析相对完整,对所有物种进行了粗尺度分布数据,并对北美物种进行了~75%的采样。这种完整程度首次为整个昆虫亚目的系统发育多样性提供了一个解析良好的、大陆尺度的视角。然而,即使扩展了终末类群的范围估计,也不能完全解决“边缘效应”问题,因为研究区域以外的相关类群范围大小仍然被忽略,这意味着较深分支的范围估计可能会很差,影响PE。
尽管我们预测温度和降水稳定性将是PD和RPD显著性的关键预测因子,但它们在任何模型中都不是顶级预测因子。相反,当前的年温度是PD显著性的主要驱动因素,在包括空间相关随机效应后,我们的预测变量在确定RPD显著性的驱动因素方面没有特别有用。下面,我们根据北美的主要地区更彻底地总结了这些结果,重点是跨地理距离和环境梯度的合成。
北美北部:我们将北美北部定义为在21000年前的最后一次冰河时期大部分被冰覆盖的地区。大陆北部的PD较低,而RPD不低。前者表明了寒冷和季节性条件导致的环境过滤的重要性,后者在冰川旋回中轨道强迫范围扩张和收缩,但有限的支裂作用。
美国西部:过去冰盖以南和温暖沙漠以北的西部地区显示出非常强的显著低PD和RPD模式。前者表明潜在的环境过滤,考虑到陡坡的海拔和气候梯度本身在更新世冰期-间冰期循环期间处于变化之中,而后者可能表明蝴蝶在这些地区经历了最近的辐射。
北美南部:北美南部地区表现出特别惊人的结果,特别是在温暖的沙漠地区。PD和RPD在北美的热带地区都显著较高,这与热带为蝴蝶多样性博物馆的观点一致。在温暖的沙漠中,我们发现了显著的高RPD,但没有迹象表明聚集或过度分散的PD。这个新结果表明,在上新世中期形成的气候中,沙漠中存在着古老的蝴蝶群落。人们早就知道,在这一地区发现的开花植物来自于荆棘丛和干旱高地的相关谱系,这些谱系在系统发育上要古老得多。
落基山脉东部:包括大平原和东部温带森林在内的落基山脉东部地区的PD和RPD并不显著,这与开花植物的空间系统发育发现形成了对比,我们将在下面详细讨论。我们特别惊讶的是,在中新世和上新世降温期间以草地为主的大平原地区,并没有出现比预期更年轻的谱系的积累(即RPD显著较低),正如在其他类群中所记录的那样。此外,佛罗里达热带地区的PD或RPD发生率并不显著较高。然而,热带佛罗里达和附近的沿海平原确实显示出显著高水平的混合PE,这与已知的植物生物多样性热点一致。
考虑到强烈的生态关联和共同的非生物驱动因素在漫长的进化时间框架中发挥作用,我们预测蝴蝶和植物具有相似的系统多样性模式,同时也承认替代假设。这一预测在非洲大陆的西部和北部得到了普遍的证实,这两个地区都受到了包括冰川作用和干旱化在内的近期扰动的影响。然而,我们的分析也揭示了显著的差异。例如,蝴蝶和开花植物没有表现出相似的RPD模式,这表明蝴蝶和被子植物之间的多样化时间和速率可能在这一分析的规模和程度上没有关联。造成这些差异的原因可能部分与方法学有关。然而,这些结果也表明,共同的历史力量和强烈的生态关联仍然可能导致不同的历史和当前生物地理结果。我们将在下面讨论更多关于相似点和不同点的方法论和生物学原理。
虽然我们在两项研究中使用了一致的PD指标,从而可以直接比较输出结果,但开花植物和蝴蝶分析的采样完整性差异很大。开花植物的采样包括比蝴蝶多一个数量级的命名物种,但在系统发育(包括约44%的分类群)和空间分布信息方面都不完整。
这些采样完整性和空间偏差的差异使得模式的强评估更具挑战性。显著的低PD(系统发生聚类)通常被认为是生境过滤,这是由于系统发生保守的生境偏好导致近亲属倾向于在群落中一起出现。很可能是栖息地偏好在种子植物中比在蝴蝶中具有更高的保护水平,这一可能性需要未来的研究。
虽然人们早就知道,北美西部已被区域构造运动、造山运动和气候变化极大地重塑,但这些影响对脊椎动物以外的动植物的全部程度刚刚开始被理解。植物空间系统发育研究以惊人的方式证实了这一点,东部温带森林显示出的植物谱系比大平原和北美西部地区的植物谱系要古老得多,两者都受到冷却和干旱化的强烈影响,显示出更多的近期多样性。我们希望在蝴蝶的RPD检测中找到一致的结果。但两组间RPD相关性不强。根据空间残差图(图6),西部的蝴蝶群落相对较年轻。此外,尽管西部的一些部分显示植物和蝴蝶的RPD低于预期,这表明与其他地区相比,那里的辐射更近,但我们在东部的蝴蝶RPD并没有像在植物中那样高于预期。在墨西哥,蝴蝶的RPD显著高于植物。
图6 对观察到的PD(A)、RPD(B)和PE(C)进行单变量线性回归的空间残差,其中被子植物指标用于预测蝴蝶指标。高残差值(蓝色)表示蝴蝶值高于预测值的区域。
这些结果表明,在不同营养水平的群体之间进行比较时,较不稳定的地区,如北美的北部和西部,可能会表现出适度的不一致性,但方式是一致的。在西方,由连续森林的丧失和持续的冷却和干燥引起的更广泛的扰动可能导致了更强的不平衡,蝴蝶紧随该地区新植物谱系的爆发而形成。相对系统发育多样性的空间残差图支持这种情况(图6),但有必要在其他食草动物中进行进一步检查,以确定这种排序效应是否更普遍。我们假设,具有更活跃地质历史的地区将显示宿主和消费者/传粉者之间的群落年龄滞后的证据。
在CANAPE发现的植物和蝴蝶的系统发育特有模式惊人地不一致,在墨西哥南部和中部发现的植物特有模式比蝴蝶强得多。Mishler等人截断了感兴趣区域南部边缘的范围,这可能会导致更多人为的范围限制和更高的地方性。尽管如此,植物和蝴蝶地方性的不一致是值得注意的,并可能指出蝴蝶和植物之间在生态、进化和生物地理过程中的根本差异,值得进一步研究。
保护蝴蝶的重要性
蝴蝶正受到威胁,最具代表性的是帝王蝶及其数量的下降。这里的结果为更好地优先考虑保护需求的地区提供了参考。我们记录了PE、PD和RPD高的地区,这些区域很可能是优先保护的区域。虽然一些热点地区早就被认识到,但了解哪里的多样性最高、最稀有、最受威胁仍是有待完成的重点工作;例如,北美沿海平原地区最近才被认为是一个热点,仍然需要进一步的工作。我们的研究结果为温暖沙漠的栖息地保护提供了强有力的证据,尤其是还没有被记录在案的生物多样性热点。
佛罗里达维管植物的空间系统发育:校准和不确定性对多样性估计的影响
最近生物多样性数据资源的可用性使我们能够在广泛的范围内估计基于系统发育的生物多样性指标。在本文中,我们探讨了系统发生源树之间的差异和系统发生不确定性的水平如何影响这些指标,并检验了关于美国佛罗里达不同维管植物区系地理生物多样性模式的现有假设。我们将1,490个佛罗里达物种的生态位模型与“专门构建的”系统发育树(系统发育图和时间图)以及来自社区资源的树(系统发育树和开放生命树)相结合。
最近生物多样性数据(空间和遗传)以及环境数据(关于气候、地形和植被)的爆炸式增长,以及新的分析方法和工具推动了物种分布建模和将这些结果组合成广泛的多样性评估,比通过较浅节点连接相同数量物种的其他地区更加多样化。系统发育方法将多样性测量从简单的物种计数扩展到也可以告知进化模式和过程的测量。
PD的计算方法是系统发生树中从特定位置连接终端类群的分支长度的总和,通常是到树的根部。PD可以解释为系统进化图中感兴趣区域所包含的“特征多样性”的数量,在一个区域中出现的无形态的数量,或者在使用时间校准的年表时,作为“进化史”的数量(Davies 和 Buckley, 2012;罗索风,2010)。对于PD较高的区域,可以优先考虑保护,因为包含更高的遗传多样性或更大量的进化史),尽管在保护评估中显然还有其他潜在的标准,如威胁状态(Jetz 和 Freckleton, 2015)。
尽管获得这种树相对容易,但它们的质量和固有的不确定性很少被研究,这些因素对PD评估的影响也没有得到很好的研究(Molina-Venegas and Roquet, 2013;Rangel et al.,2015;Thornhill et al.,2017)。树的拓扑结构和分支长度都是由类群的采样和所采用的基因序列决定的,在计算和解释PD测量时必须考虑这些因素。例如,从一棵树上进行有限的分类学采样会产生比真实存在的更长的单个分支,而对遗传数据进行有限的采样可能会导致不具有代表性的分支长度。同样,使用种系图和时间图会产生分支长度差异,因此PD测量值也会不同。
本文以佛罗里达维管植物为例,全面分析了输入系统发生树的选择和系统发生不确定性的纳入如何影响PD指标的评估。为了测试输入树的重要性,我们开发了系统发生树,具体目的是通过与分布模型的集成来估算生物多样性。
我们选择佛罗里达作为研究的重点,因为它是约4300种本地或驯化维管植物的家园,并且拥有广泛的陆地和水生栖息地(Wunderlin 等,2017)。此外,佛罗里达是北美沿海平原生物多样性热点的一部分(Noss et al.,2015),也是美国联邦敏感、受威胁和濒危物种密度第三高的地区(Ihlo 等人,2014 年),仅次于加州和夏威夷(多布森等人,1997 )。此外,佛罗里达三分之一的植物群现在是由外来物种(自然或入侵)组成的,由于人类发展而导致的栖息地丧失越来越多(Gordon, 1998)。然而,尽管该地区的生态和保护问题非常严重,但人们对佛罗里达植物多样性的总体地理格局知之甚少。
我们的实证目标是检验关于佛罗里达生物多样性模式的假设,这些假设来自于之前对森林类型、脊椎动物和蝴蝶的研究。特别是,通过记录佛罗里达从北到南的多样性整体下降的工作,尽管这种模式只是根据各种脊椎动物和蝴蝶的丰富度地图进行了定性评估。
本研究的方法目标是探讨系统发生树的选择对空间系统发生量度(PD和RPD)的影响,并提供一种更有效地解释系统发生树中不确定性来源的方法。我们使用多种输入系统发生树生成PD和RPD,并使用多种方法比较结果,以理解如何解释这些评估的差异和不确定性。我们还研究了从现有超级树修剪的树木和从策展分析中推断出的树木之间的空间系统发育指标如何变化,在策展分析中,使用一种战略方法进行基因采样和分支长度评估,做出了严格的努力来缩小分类单元采样中的差距。最后,我们使用贝叶斯框架生成了代表系统发育估计不确定性的树分布,以评估对PD的影响。
结果
所有模型的验证指标均较高,训练曲线下面积(AUC)评分均>0.8分,几乎所有情况下的测试AUC评分均在训练评分的0.15分以内。一小部分模型的表现明显较差,其中训练和测试的差值为>0.5。我们删除了离群点AUC评分与最终分析的均值相差>3个标准差的物种。最终,接受了1490个模型(即。每个物种一个)。图1显示了佛罗里达4公里分辨率下基于堆叠模型的物种丰富度,从最低的57个物种到最高的856个物种。图2总结了全州观察到的PD指标,包括谱系图和时间图。
基于这两个质粒基因的维管植物之间的亲缘关系与基于更多基因和类群的系统发育分析结果基本一致。已知的迅速辐射的谱系(如菊科)也如预期一般表现出较短的分支。同样,由于分支长度短,也有进化支的系统发育分辨率非常低。佛罗里达维管植物的整体系统发育框架与基于更广泛地理分析的公认框架高度相似,维管植物亚分支之间的关系也反映了其他研究的结果。
图1所示。佛罗里达维管植物的种系图、时空图和物种丰富度(A)佛罗里达1490种维管植物的种系发生,如图(左)和(右)所示。年表上的黑点表示17个校准点的位置。(B)显示物种丰富度的地图,其中一个网格细胞的PD在系统图和时间图上用红色突出显示。
拓扑与已发表的分析不同的少数实例都是与预期的微小偏差,并且是有限数据集(即数据集)的结果。考虑到佛罗里达的维管植物只是全球多样性的一个小子集,这些偏差也可能反映了采样问题。
图2 佛罗里达维管植物的系统发育多样性从维管植物的系统发育图(左)和时序图(右)测量的观察到的(上面板)和显著的(下面板)系统发育多样性。在最上面的面板上,环境保护署(EnvironmentalProtectionAgency)的III级生态区用深色线标出,IV级生态区用浅色线标出,并标出了感兴趣的区域,如威尔士湖岭和迈阿密岭。
PD分析,因为支持更好的长分支贡献了绝大多数PD(Gonza´lez- Orozco 等, 2016)。用化石约束对这棵树进行校准(表S4),得到了与下游分析中的系统图进行比较的时间图(图1);该年表相对于谱系图平滑了分支长度(参见图1进行比较)。
相对于美国环境保护署(EnvironmentalProtectionAgency)的III级和IV级生态区(图2)和纬度(图3)绘制佛罗里达州的PD图,揭示了生态和地理模式。PD最高的地区为佛罗里达州半岛北部,南部至奥兰多和圣彼得堡附近。在谱系图和时间图中,佛罗里达州中部的PD高于该州北部和南部(图2)。在纵向上,佛罗里达州南部呈现出混合模式;大沼泽和大柏树的PD相对较低,而同一纬度的迈阿密岭的PD相对较高(可见图3在26.5N朝向正PD值的长尾)。各生态区的平均PD值也显示,贯穿佛罗里达半岛的南部沿海平原的PD高于其他地区(表1)。
在谱系图和时间图上测量的PD显著高或显著低的地区存在差异(图2)。时间图得出的值显示,佛罗里达州北部和中部地区有很强的均匀模式,特别是在东南部沿海平原生态区。相比之下,基于种系图的PD显著性更直接地代表了特征多样性,显示了该州几个地区的种系发生聚类,特别是佛罗里达西北海岸沿线,任何地方都很少均匀。
图3 纬度系统发育多样性研究区域以0.5?分成13个纬度剖面,用右边地图上的线表示。左边的豆状图分别代表了系统发育图(上)和时间图(下)中每个剖面内像素的系统发育多样性值
RPD模式在谱系图和时间图之间也有显著差异。在时间图和种系图得出的值之间存在主要差异的地理区域包括(图4):(1)佛罗里达北部,时间图产生了高观察值的RPD,以及更广泛的显著高RPD浓度(即RPD)。分支比预期的要长),比系统图得出的结果要长;(2)佛罗里达州中部,那里的系统进化图通常没有显示出显著的低RPD(即RPD)。比预期的分支更短),而时序图则如此;(3)佛罗里达非常南部,包括迈阿密山脊地区
表1 对三个生态区所包含的细胞进行PD和SD计算,用于系统进化图和时间图
图4 相对系统发育多样性从维管植物的(A和C)系统发育图和(B和D)时序图中测量的观察到的(上面板)和显著的(下面板)相对系统发育多样性。
由于分支长度是通过相同的排列确定的,因此预计专门构建的树和OTL的树之间存在相似。每个源系统图产生的PD值在佛罗里达狭长地带和半岛佛罗里达沿线显著聚集,而每个源时间图产生的PD值在狭长地带北部边缘呈现均匀性。我们发现,OTL树和专门构建的树最相似,只有不到5%的细胞对亲缘关系衍生值显示显著性差异,不到20%的细胞对基于时间轴的值显示显著性差异。利用Phylomatic树进行的测量,尽管删除的类群较少,但与专门建造的树有更多的差异超过25%的细胞表现出不同的显著性结果(图5;表2).不同方法之间的分类单元采样差异适度影响了这一空间系统发育度量(例如,在分类单元较少的情况下,只有LWR以东的区域作为系统发育图中显著的聚类区域是突出的;图5b)。
总体而言,根据100种时间计图计算的PD评分的标准差大于根据100种谱系图计算的标准差,两种地图之间的相似性在狭长地带和佛罗里达最明显(图6A-6C)。
图5 多样性假设检验比较了使用我们的特制树、Phylomatic树或开放树构建的维管植物的时间图和种系图
顶部面板是专门构建的树的种系图和时间图,修剪为(A)种系和(B)开放树分类集。中间的面板是(A)种系树和(B)开放树树。下方的面板是两幅地图的差异。灰度像素是指种系目的构建树与开放树目的构建树在显著性水平上发生变化的像素。
讨论
我们在佛罗里达半岛北部(而不是在狭长地带)发现了植物多样性的高峰。虽然佛罗里达半岛北部的PD可能是最高的,但许多狭长地带的PD明显多于预期,特别是在考虑时间图而不是系统图时。东南森林由包含深度进化分支的群落组成,特别是在时间校准的系统发育中。在最后一次间冰期完全被淹没的南佛罗里达(Germain-Aubrey 等人,2014),我们发现了一种不同寻常的种系多样性模式,其中只有种系图显示了RPD的强烈信号,即RPD。在零假设的前提下,分支明显比预期的长。我们认为,通常朝向尖端的分支相对较长的种系图在某些情况下可能比时间图显示出更强的模式,时间图倾向于将分支长度从末端重新分配到较深的分支(如图1所示)。在佛罗里达南部,加勒比或中/南美洲起源的类群群落可能以较长的末端分支为主。进一步检查群落组成和方法选择可能产生的伪影是有必要的。
表2.显示树资源之间不同结果的单元格数
上图:在我们的贝叶斯分析中,所有(A)100个种系图和(B)100个时间图中观察到的系统发育多样性的标准差。(C)右边用蓝色表示的两者之间的差异。底部:浅蓝色的区域是指有91(100)棵或更多的树具有相同显著性水平的区域。黄色的区域大多是一致的,100棵树中有71-90棵发现了相同的显著性水平。红色的区域是相对不一致的像素,只有50-70棵树对(D)100种系统图和(E)100种时间图具有相同的显著性水平。
在佛罗里达州中部半岛,我们发现了比使用系统发育图或时间轴图预期的更强的系统发育聚类模式和更短的分支。虽然佛罗里达中部是一个植物多样性丰富的地区,但它包括在更新世间冰期海平面上升期间被淹没的地区,以及更持久的旱灌丛,但由于某些谱系对这些地区恶劣环境(例如过度排水的土壤和极端高温)的进化保守偏好,共存的类群可能被过滤了。或者,这种模式的一部分可能是由于原位分化,而一些类群可能是较近期到达的。
我们的结果也与在其他远亲动物世系中发现的结果一致。利用佛罗里达差距分析,记录了脊椎动物和蝴蝶的高物种丰富度,特别是在狭长地带,并延伸到佛罗里达中部的核心。
表3 每一类不确定性中的单元数Class表示具有一致显著性水平的树的数量。例如,50-70类表示对于那些像素中50-70的树具有相似的显著意义,而50-30的树不具有相似的显著意义。对于71-90类,更多的树是一致显著的,而对于91-100类,大多数树发现了相同的显著性水平,这表明在考虑系统发育估计的不确定性时,这些像素是一致的。
图7 不同纬度的系统发育多样性的不确定性研究区域以0.5?分成13个纬度剖面,用右边地图上的线表示。豆状图分别代表了系统谱系图(左)和时间序列图(右)中每个剖面内每个像素的所有100棵树的系统发育多样性值。
最后,考虑到已知的流行区和不同寻常的植物群,两个特别值得关注的地区是迈阿密脊松岩地和LWR(位置见图2、左上角和图S3)。正如预期的那样,在迈阿密脊地区,我们发现基于时间图的一些像素的PD增加和显著的PD聚类,而在系统图的其他像素的RPD显著高。特别是LWR,已知具有高度的地方性物种多样性(Myers and Ewel,1990;Germain-Aubrey et al.,2014),我们假设在未来使用系统发育地方性指标进行检查时,可能会显示出高度的新地方性。紧邻LWR东部的区域则表现出较强的聚集性,该地区是一个栖息地马赛克,包括松平原、干燥草原和沼泽(Myers and Ewel,1990),该地区的显著聚集可能表明这些栖息地有很强的过滤作用。在迈阿密脊松岩地等地区也发现了保护优先区,这些地区受到快速、持续的人类发展的直接威胁,为保护行动提供了进一步的有力理由。
蕨类植物(单生植物)、裸子植物和被子植物的主要进化支之间的关系与专注于这些特定亚进化支的更广泛的系统发育分析密切一致(例如,被子植物系统发育组 IV, 2016;Schuettpelz and Pryer, 2007;Smith et al.,2011;Soltis et al.,2011;史蒂文斯,2001)。在专门构建的佛罗里达树上,一些比较困难的区域在OTL生成的拓扑中得到了适当的解决。这可能是由于OTL的不断更新特性,其中树拓扑将以前估计的树集成到框架中,以产生一个”合成”树。本研究结果提示,OTL可能是未来空间系统发育分析的重要资源。如果在OTL中所代表的区域有足够的终端类群采样,研究人员将能够节省大量的时间来构建自己的区域特定的树。
虽然进化树和OTL可以给出相对准确的拓扑结构,但计算这些树的分支长度仍然存在问题,特别是在使用种系图时。为了解决这个问题,我们使用DNA序列比对来估计OTL拓扑上的分支长度,这可能解释了为什么我们发现,与进化树树相比,基于我们专门构建的树和OTL树的结果之间的差异较小(图5)。然而,这种方法需要为OTL系统发育树组装比对,这可能无法达到使用这些资源的目的。目前正在进行的工作是将分支长度估计添加到OTL方法中,这将进一步提高OTL作为空间系统发育分析来源的强大效用。
分类单元采样可能是使用存储库中的树的另一个问题。进化树几乎包含了我们所有的终端类群(99%),比OTL树的类群(80%)还要多。如果我们试图对佛罗里达的所有维管植物物种进行分析,目前还不清楚有多少分类群是可用的。我们发现,当去除250个类群时,佛罗里达中部显著成簇的细胞数量显著减少(图5)。这一结果表明,更有限的分类抽样可能会降低一些功效。然而,我们目前的分析可能合理地捕捉了佛罗里达州PD的总体趋势,提供了急需的多样性初步快照。
图6显示,大约20%的像素在100棵树中表现出中度到高度的显著性差异,在不显著和显著高或显著低之间翻转(但从不从显著高到显著低)。在系统图和时间图中都发现了这种模式,尽管时间图的每像素标准差要高得多。
从我们的分析中可以得到两个关键信息。首先,虽然不确定性可能会影响对某些网格细胞的PD和RPD显著性的判断,但这些细胞似乎没有地理结构,因此本文中观察到的少量不确定性不会在景观尺度上广泛影响结论。
谱系图和时间图这两个指标都以不同的方式提供信息。根据定义,在系统图上测量PD高的区域具有较高的遗传多样性,如果目标是保存遗传多样性,这可能是更好的测量方法,而在时间图上测量PD高的区域包含异常大量的进化时间,如果目标是保存进化多样性,这可能是更好的测量方法。
研究的局限性
虽然这项研究包括了佛罗里达植物的1490个分类群,但已知该州有4000多个维管植物物种,完全纳入所有物种可能会影响本文的结果。收集更完整的分布数据,特别是范围受限物种的进一步努力正在进行中,这些记录有望帮助进一步的物种分布建模。我们注意到,尽管使用一小组标记恢复的系统发育与已知的关系一致,但下一步将进一步开展工作,以开发更可靠的系统发育假设。最后,进一步的工作将这些模式与人口高速增长和海平面上升的地区联系起来,将为保护工作和提供参考。
基于先进机器学习技术的全球植物多样性模型和预测
尽管植物多样性对生态系统功能、生物地球化学循环和人类福祉起着至关重要的作用,但关于其全球分布的知识仍然不完整,阻碍了基础研究和生物多样性保护。在这里,我们使用机器学习(随机森林、极端梯度增强和神经网络)以及传统统计方法(广义线性模型和广义加性模型)来检验大尺度维管植物多样性梯度的环境相关假设,并在全球范围内建模和预测物种丰富度和系统发育丰富度。为此,我们使用了830个区域植物目录,包括约30万个物种过去和现在环境条件的预测因子。机器学习表现出了优异的性能,可以解释高达80.9%的物种丰富度和83.3%的系统发育丰富度,说明了这种技术在解释环境与植物多样性之间复杂关系的巨大潜力。当前的气候和环境异质性是主要的驱动因素,而过去的环境条件对植物多样性的影响很小,但可以检测到。最后,我们结合多种建模技术的预测(集合预测),在7774平方公里的多个分辨率上揭示了全球植物多样性模式和中心。我们的预测地图提供了宏观生态学相关的全球植物多样性的准确估计。
维管植物包括超过34万个物种(Govaerts等,2021年),是陆地生态系统维持生态系统功能(Tilman等,2014年)和提供生态系统服务的基础(Isbell等,2011年;Cardinaleetal.,2012)。为了保护和管理这一全球生物多样性的重要组成部分,了解其空间分布和生物多样性中心的位置至关重要。从19世纪开始,通过整理区域植物物种数量和专家绘制的物种丰富度等值线(Wulff,1935;BarthlottEtal.,2005;参见Mutke&Barthlott,2005年)。,绘制植物分布和多样性的地图具有悠久而丰富的传统。从那时起,通过对环境和空间变量响应的多样性模式建模(Keil&Chase,2019;Sabatini等人,2022年),这些地图被细化和缩放到不同的分辨率(例如12100公里2在Kreft&Jetz,2007),允许在全球范围内进行连续预测。这种预测图的准确性取决于现有植物多样性数据、环境预测因子和应用模型的质量和代表性。最近在数据可用性和建模技术方面的发展使植物多样性模型具有迄今为止前所未有的分辨率和准确性。
近年来,基于国际上动员整理物种发生记录的努力,对全球植物分布和植被样地(Sabatini等人,2021年)以及区域清单、植物区系的了解有所增加(Enquistetal.,2016;GBIF,2020年)。然而,这些数据在精度、完整性和范围上有所不同(K€onigetal.,2019)。具体来说,细粒度的数据,如发生记录和植被图,往往在地理上有偏差,仅覆盖部分区域植物区系(Meyeretal.,2016;Qianetal.,2022)。尽管是粗粒度的,并且经常被人为划分,但行政边界、清单和植物区系反映了迄今为止最完整和最权威的区域植物区系组成,并且几乎完全覆盖全球(Weigelt等人,2020;Govaerts等人,2021年)。因此,清单和植物区系是植物多样性-环境关系全球尺度建模以及预测不同粒度的植物多样性(Keil&Chase,2019)的有用资源(Kreft&Jetz,2007)。包括物种身份进一步推动整合物种级别的系统发育和性状信息,为研究生物多样性的多个方面提供了机会。
尽管人们普遍认为植物多样性反映了进化、地质和生态过程的复杂相互作用,但解开全球植物多样性的驱动因素仍然是现代宏观生态学的一个重要主题(Kreft&Jetz,2007;Tietjeetal.,2022)。一些与地理、过去和现在的气候以及一个地区的环境异质性有关的假设(Currie等,2004;Mittelbachetal.,2007)被提出来解释植物多样性模式。例如,大而异质性的地区被假设通过提供更多样化的资源和栖息地来支持更多的物种,从而促进物种共存(Connor&McCoy,1979),并在环境波动期间提供避难所(Steinetal.,2014)。此外,温暖、潮湿和相对稳定气候的地区,如潮湿的热带森林,由于高物种形成,应该支持更多的物种(Rohde,1992;Mittelbachetal.,2007;Brown,2014)和低灭绝率(Gillooly&Allen,2007;Eiserhardtetal.,2015)。地理隔离可能同时促进物种灭绝(Brown&Kodric-Brown,1977;Ouborg,1993)和物种形成(Kisel&Barraclough,2010)。最后,历史过程,如过去的板块构造和气候变化,通过改变生物隔离和交换或物种范围转移,影响了多样性模式(Dynesius&Jansson,2000;Svenningetal.,2015;Couvreuretal.2021)。
多样性-环境关系通常是复杂的、非线性的和尺度依赖的(Francis&Currie,2003;Keil&Chase,2019)。许多环境预测因子相互作用并表现出高度共线性,因此对常规统计模型(如广义线性模型(GLMs)和广义可加性模型(GAMs)提出了重大挑战。机器学习方法代表了强大的建模工具,可以有效地处理相关数据,并可以揭示非线性关系和预测器之间的相互作用(Oldenetal.,2008;Criscietal.,2012),而无需先验规范。因此,机器学习已经成为生态学中传统技术的一种有前途的替代方案(Hengletal.,2017;Parketal.,2020;Sabatini等人,2022)。
在此,提出改进模型和预测维管植物多样性的两个关键点,即物种丰富度和系统发育丰富度,在全球范围内使用先进的统计建模技术。除了非空间和空间glm和gam之外,我们还系统地评估了机器学习方法的预测性能,包括随机森林、极端梯度增强(XGBoost)和神经网络。具体而言,我们的目标是:比较不同建模技术在揭示复杂的多样性-环境关系方面的表现,并改进全球地理统计植物多样性模型;检验与地理、环境异质性、当前气候和过去环境条件相关的植物多样性梯度假设,并量化其对植物物种和系统发育丰富度的相对重要性;以及,在全球范围内预测多种粒度下植物多样性的两个方面。我们的研究基于全球830个地区的清单和植物群中的约30万个物种(图S1),这些物种在《全球植物群和性状清单》中进行了整理(Weigelt等人),。
结果和讨论
植物多样性模型的性能
表1基于交叉验证的维管植物多样性全球模型性能
使用随机10倍和空间68倍交叉验证来评估每个模型的预测性能。除最小充分广义线性模型(GLM)和具有相互作用项的GLM外,非空间模型拟合了代表地理、当前气候、环境异质性和过去环境条件的15个预测因子(表S1)。此外,空间模型还包含空间项(即同步自回归(SAR)模型,包括地理坐标样条的广义可加性模型(GAMs),以及包括三次多项式趋势面的机器学习方法)。基于赤池的信息准则(AIC),对完整的GLM进行简化,得到最小充分GLM。拟合了具有相互作用项的GLM,拟合了全部GLM的预测因子以及能量-水、能量异质性和区域环境相关变量的相互作用,并基于AIC进行了简化。由于响应变量(即物种和系统发育丰富度)在模型中是对数转换的,因此精度统计数据是在对数尺度上提供的。基于所有袋外样本,所示值为均方根误差(RMSE);由模型解释的变异量,计算为1减去观测与预测之间的误差平方和与总平方和(R2)之比。
我们的研究结果揭示了机器学习,特别是决策树方法在模拟植物多样性与环境关系以及在不同尺度上准确预测植物多样性方面的巨大潜力。总体而言,模型的预测能力很高(表1)。机器学习模型和GAMs优于GLMs和空间模型(即包含空间项的模型,以考虑区域的空间非独立性;Dormann等,2007)的总体表现优于非空间模型(物种丰富度的GLMs除外)。极端梯度增强是一个序列训练决策树的集合,它对物种丰富度(基于空间交叉验证的变异解释为70.3%,基于随机交叉验证的变异解释为80.9%)和系统发育丰富度(分别为73.7%和83.3%)产生了最准确的预测,这在空间和非空间模型中是一致的。
我们发现空间项和环境变量之间存在很强的相互作用。这表明了植物多样性和多样性-环境关系的区域差异,并表明在预测跨地理区域的多样性时,不同的环境变量组合是重要的(Keil&Chase,2019)。此外,机器学习模型揭示了能源和水可用性、能源和环境异质性以及面积和环境变量之间的强相互作用。通过隐含地考虑谷物依赖和空间和环境变量之间的复杂相互作用,我们的机器学习模型优于以前的植物多样性模型(Kreft&Jetz,2007;Keil&Chase,2019),提高了我们对多样性-环境关系的理解,并可改进跨尺度植物多样性的预测。
维管植物多样性全球模式的驱动因素
图1:在五种非空间模型中解释维管植物多样性全球格局的环境变量类别的相对重要性(a)物种丰富度;(b)系统发育丰富度。不同变量类别的相对重要性(缩放到总和为1)计算为1减去使用随机重新洗牌的数据集的模型预测和使用原始数据集的预测之间的斯皮尔曼秩相关系数。每一类环境变量如表S1所示。单个环境变量的重要性见图S19。GAM,广义加法模型;GLM,广义线性模型;XGBoost,极端梯度增强。
当前气候变量是植物多样性最重要的驱动因素,占物种丰富度变化的34.4%~48.1%,占系统发育丰富度变化的39.7%~58.2%。(图1;表S1)高能量和水的可用性以及低季节性促进了物种和系统发育的丰富度(图S5,S6),支持了其他大规模研究,这些研究报告了当前气候对植物多样性的强烈影响。环境异质性解释了物种丰富度变化的21.0-40.9%,解释了系统发育丰富度变化的16.3-27.2%,异质性的增加导致了更高的植物多样性,正如预期的那样。尽管物种和系统发育丰富度高度相关(Pearson的r=0.98),但在多样性与环境的关系中仍存在一些差异。例如,环境异质性对系统发育丰富度的解释低于物种丰富度的解释。这可能反映了由高环境异质性促进的原位物种形成信号,产生了密切相关的物种集群,与物种丰富度相比,系统发育丰富度相对较低。考虑物种丰富度后,土壤类型数量对系统发育丰富度剩余变异的负影响也支持了这一观点(表S2)。
地理变量(面积和地理隔离)解释了物种丰富度的9.8~23.1%,系统发育丰富度的18.0~24.6%。较大的区域往往具有较高的原位物种形成率,因为区域内地理隔离的机会更多,而由于人口较多,灭绝率较低。这些影响应该在独立的、孤立的地区最为明显,而在与其周围环境相似的地区则不那么明显。此外,更大的区域通常提供更多种类的栖息地,为物种提供更多的环境生态位。地理隔离,这里测量的是周围陆地的比例,并不能解释太多的变化,这可能是因为我们的数据集主要由大陆地区组成。虽然地理隔离是岛屿植物多样性的主要驱动因素,但隔离和半岛效应似乎在大陆上只发挥了很小的作用,在大陆上,地理隔离可能对区域的组成独特性和地方性更重要,而不是丰富度。
因为低灭绝和高物种形成率,我们假设较高的植物多样性将积聚在气候长期稳定的地区,因此,我们评估温度稳定性和生物群落变化作为两个古时期(LGM和上新世中期暖期)过去的气候变化。与历史变量对现代植物多样性的预期遗产效应相反,过去在我们大多数的模型中,环境条件对物种丰富度的解释仅为0.8-5.5%,但在神经网络中高达23.8%。同样,过去的环境条件对神经网络系统发育丰富度的解释能力(15.0%)高于其他模型(4.0-8.5%)。包括空间趋势面或离散的生物地理区域(即植物区系王国)的模型(在统计上控制了当前和过去的环境后)进一步改善了模型的拟合(表1,S4)。这表明,除了LGM或上新世中期暖期以来的气候稳定性外,上新世之前的生物地理历史或气候变化以外的区域特征影响了现代植物多样性。这些历史区域效应可能是由于分散障碍、特殊的殖民和多样化的历史(Qian&Ricklefs,2004;Ricklefs&He,2016)。
改进的全球植物多样性地图
图2:在分辨率为7774平方公里的等面积六边形网格上预测维管植物多样性的全球格局。物种丰富度(a)和系统发育丰富度(Faith的PD,d)基于五种不同模型(即使用机器学习方法的三个空间模型、一个空间广义加性模型和一个具有相互作用的非空间广义线性模型)的集成预测,模型精度加权;物种丰富度(b)和系统发育丰富度(e)中心被定义为预测丰富度高于预测值的第90分位数的区域(即包含至少1765种植物和每7774km2的41866Ma的系统发育丰富度)。用于集合预测的模型之间的预测变化是通过物种丰富度(c)和系统发育丰富度(f)预测值的变化系数来计算的。水平线描绘了赤道和热带边界。在(a)和(d)中,所有地图都使用EckertIV投影。
我们制作了维管植物物种和系统发育丰富度的全球多样性地图,基于个体良好的模型和模型集合。由于其出色的预测能力和处理缺失数据的能力,我们认为XGBoost(包括地理坐标)是预测植物多样性最强大的单一模型(图S20d,S21d)。此外,我们还提出了集合预测,减少了选择特定建模技术所带来的不确定性,从而提高了预测精度(Marmionetal.,2009)。包括区域面积及其与其他预测变量的相互作用,我们可以预测不同粒度的等面积和等距六边形全球网格。
我们的整体预测(图2a,d)以前所未有的细节和准确性描述了物种和系统发育丰富度的全球模式。这些地图捕捉了多样性如何随环境梯度变化,并确定了植物多样性的全球中心(图2b,e)。Barthlott等人,2005;Kreft&Jetz,2007)。虽然系统发育丰富度的模式与物种丰富度非常相似(Pearson的r=0.97),但在地中海周围、中美洲、高加索和喜马拉雅地区也存在差异(图S24)。高分辨率的环境数据和建模技术使得陡峭海拔梯度的地区在预测效应方面表现出更细微的变化(Barthlott等人,2005;Kreft&Jetz,2007)。
与此同时,我们的整体预测显示,在物种贫乏的地区,如格陵兰岛和撒哈拉沙漠的非冰川地区,数值相对较高。在这里,以及在具有植物多样性极值的其他区域,单个模型的表现优于集成模型(图S20,S21),后者倾向于衰减极值。物种和系统发育丰富度较高的区域主要分布在山区(图S26)。具体来说,热带山脉,包括热带安第斯山脉、东非高地和各种亚洲山脉(如中国南部和马来群岛),是全球植物多样性的中心。正如之前的研究发现的那样(Testolin等,2021年),热带山脉的高度多样性与温暖潮湿的气候和异质性环境有关(安东内利等,2018年)。多种生物地理和进化过程,包括由山区长期造山和气候动态驱动的物种形成、扩散和持久性,导致了突出的区域植物多样性。造山过程不断改变山区的土壤成分、营养水平和当地气候,从而创造出新颖而异质的栖息地,植物谱系在这里多样化并从邻近地区迁移。此外,气候波动通过驱动山地内栖息地连通性的动态变化来刺激多样性(Rahbek等,2019)。由于其陡峭的环境梯度和异质性,山区在气候不利时提供了避难所(Bennettetal.,1991;Rahbek等人,2019年)。
在极端环境的地区,如沙漠和北极地区,模型之间的差异(以变异系数衡量)最大(图2c,f)。北极地区在各模型中也始终表现出最高的预测不确定性(图S27,S28)。极端环境地区的不确定性可能源于两个原因。首先,物种极度匮乏的地区可能在已发表的多样性数据中不太有代表性。具有极端环境的区域通常是人为划分的区域的一部分,而不是单独采样(例如,乍得和利比亚的采样而不是撒哈拉沙漠)。这些人为划定的区域环境异质性更强,削弱了环境因子和植物多样性的极端值。众所周知,即使对于环境相对同质的区域,清单和植物区系不仅包括优势植被信息,也包括无区域植被信息,使其比主流条件下的预期更丰富,并可在更局部的尺度上观察到(与Sabatinietal.,2022年的alpha多样性预测相比)。
结论
我们提供了迄今为止最准确和全面的区域维管植物物种和系统发育丰富度的预测全球地图。它们基于显著改进的全球模型,使用了全面的植物分布数据、高分辨率的过去和当前环境信息,以及先进的机器学习模型。我们的研究结果说明,机器学习方法适用于大分布和环境数据集,有助于明晰环境和植物多样性之间潜在的复杂和相互作用的联系。因此,机器学习方法有助于提高生物地理学和宏观生态学的基础理解和定量知识。更新的多种粒度维管植物多样性地图为大规模生物多样性监测和植物多样性起源研究提供了坚实的基础,并为未来的全球生物多样性评估和环境政策提供支持。
Earl, C., Belitz, M. W., Laffan, S. W., Barve, V., Barve, N., Soltis, D. E., ... & Guralnick, R. (2021). Spatial phylogenetics of butterflies in relation to environmental drivers and angiosperm diversity across North America. Iscience, 24(4), 102239.
Allen, J. M., Germain-Aubrey, C. C., Barve, N., Neubig, K. M., Majure, L. C., Laffan, S. W., ... & Soltis, P. S. (2019). Spatial phylogenetics of Florida vascular plants: The effects of calibration and uncertainty on diversity estimates. IScience, 11, 57-70.
Cai, L., Kreft, H., Taylor, A., Denelle, P., Schrader, J., Essl, F., ... & Weigelt, P. (2022). Global models and predictions of plant diversity based on advanced machine learning techniques. New Phytologist.
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除