CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
双角草在我国的潜在适生区预测及其生态特征分析
作者:邵秀玲 厉艳 徐丽 姜晓菲 季蕾 孙铮 齐振华
邵秀玲 厉艳 徐丽 姜晓菲 季蕾 孙铮 齐振华
摘 要 双角草是一种繁殖能力极强的阔叶杂草,现分布于北美洲、亚洲等地区,该杂草在中国的适生范围尚不明确。本研究采用R语言软件的Kuenm语言包来优化MaxEnt模型参数,利用Maxent软件对双角草在我国潜在适生区进行预测,使用ArcGIS软件制图和适生等级分类,依据受试者工作特征(Receiver Operating Characteristic Curve,ROC)曲线评价Maxent模型预测的准确性,根据刀切法检验、环境变量建模贡献率和置换重要值选择影响双角草分布的主导环境变量,根据环境变量响应曲线计算主导环境变量的适生阈值。选择最优模型参数(deltaAICc = 0、AUC = 0.9091、5%数据遗漏率= 0.0497)建模,结果表明双角草在我国的潜在适生区面积总计为95.57万km2,约占国土总面积的9.96%,适生区相对集中且主要分布在我国东南低山丘陵平原地区,鉴于其较强的适生能力、繁殖能力和经济重要性,应引起高度关注。上述预测结果可为有关部门对该杂草制定检疫和防控措施提供参考。
关键词 双角草;有害生物风险分析;适生区预测;最大熵生态位模型
Estimation of Potential Suitable Distribution Areas and Ecological Characteristics of Diodia virginiana L. in China
SHAO Xiu-Ling 1 LI Yan 1 XU Li 2 JIANG Xiao-Fei 2 JI Lei 1 SUN Zheng 1 QI Zhen-Hua 1*
Abstract Diodia virginiana L. is a highly reproductive broad-leaved weed distributed in North America and Asia, yet its suitability region in China remains unclear. This study utilized the R language kuenm package to optimize the MaxEnt parameters, with ArcGIS software used for mapping and classification of suitability levels. The accuracy of the Maxent model prediction was evaluated based on the Receiver Operating Characteristic Curve. We selected dominant environment variables that affect the distribution of Diodia virginiana through the knife cut test, environmental variable modeling contribution rate, and permutation importance value analysis. We calculated the fitness threshold for dominant environment variables based on the response curve. Optimal model parameters(DeltaAICc = 0, AUC = 0.909, Omission rate at 5% = 0.0497) were selected for modeling. Results indicate a total potential suitable area of 955700 km2 for Diodia virginiana growth in China, accounting for approximately 9.96% of the total land area, with concentrations in the low hills and plains region of Southeast China. Considering its strong adaptability, reproductive ability, and economic importance, increased attention to this weed is warranted. Moreover, the predictions offer valuable insights for relevant departments to formulate quarantine and control measures.
Keywords Diodia virginiana L.; pest risk analysis; prediction of suitable distribution areas; MaxEnt model
基金项目:国家重点研发计划(2021YFD1400100,2021YFD1400103)
第一作者:邵秀玲(1971—),女,汉族,山东文登人,本科,研究员,主要从事植物检疫工作,E-mail: ciqshao@163.com
通信作者:齐振华(1985—),男,汉族,山东陵县人,硕士,高级农艺师,主要从事植物检疫工作,E-mail: qzh2000@163.com
1. 青岛海关技术中心 青岛 266114
2. 青岛大港海关 青岛 266005
1. Technology Center of Qingdao Customs, Qingdao 266114
2. Qingdao Dagang Customs, Qingdao 266005
双角草(Diodia virginiana L.)为茜草科Rubiaceae双角草属Diodia L.植物,该草为多年生草本植物,植株匍匐或斜上升;茎有4棱,棱角上被侧生毛;分枝长达60 cm。叶椭圆状披针形至倒披针形,边缘有小齿;叶对生,叶柄长约3 mm;花通常单朵腋生;萼裂片2,线状披针形,长5~7 mm,被短柔毛;花冠白色,檐部直径达18 mm,冠管纤细,长达15 mm,内外均无毛,裂片里面被柔毛;花丝长约2 mm;花柱长约13 mm,无毛,柱头长达4 mm。果被柔毛,椭圆形,长6~9 mm,宽4~6 mm,有8条隆起的棱脊,冠以2片延长的宿萼裂片[1];种子5~6 mm×2~3 mm,背部凸起,表面有网纹,脐生于腹面,前部有纵槽。
双角草原产美洲,现主要分布于美洲、亚洲部分地区。1987年在中国台湾新竹有分布报道[2],2013年在安徽芜湖和六安[3]、2016年在安徽宣城、2017年在广西富川[4]采集到标本。该杂草适应性强,对生活环境要求低,可以在潮湿的草地、沼泽、溪流和池塘中生存,也可在排水不良或潮湿的草坪上生长,与原始植被争水肥,破坏生态系统与生物多样性,在草坪上形成非常密集的种群区域,是公认的草坪上最难防治的阔叶杂草之一[5-6]。双角草种子有浮力,产量丰富,可以通过水源传播,根系可深入地下几英尺,地下茎亦可繁殖,手工防除方式通常对其无效,广泛的根系系统和强大的无性繁殖能力使得其防治极其困难[7-8]。为更好地开展有害生物鉴定与普查工作,因此开展双角草适生性研究,可有效保证针对该草普查的方向性与准确性,以期更好地保护我国农业生产和生态环境安全。
适生性分析是外来物种风险分析的重要内容之一,目前应用较广的模型包括BIOCLIM、DIVA-GIS、CLIMEX、GARP、MaxEnt等[9-10],其中MaxEnt是应用最为广泛的模型。利用MaxEnt模型已成功预测了假苍耳Cyclachaena xanthiifolia[11]、刺槐叶瘿蚊Obolodiplosis robiniae[12]、苹果根结线虫Meloidogyne mali[13]、短颈剑线虫Xiphinema brevicollum[14]、相似穿孔线虫Radopholus similis[15]等多种外来物种的潜在分布区。本研究根据双角草的已知地理分布数据,结合气候环境数据,综合利用MaxEnt和ArcGIS,预测双角草在我国的适生区,为相关部门制定检疫和防控措施提供参考。
1 材料与方法
1.1 物种分布数据来源及处理
双角草的地理分布信息通过查询全球生物多样性信息平台、查阅相关文献,共获得7879条地理分布记录。利用ENMTools软件对地理分布数据进行筛选,得到有效分布记录2337条[16],主要分布在北美洲的美国、墨西哥,亚洲的印度、日本、韩国。将双角草地理分布资料转存为csv格式,作为MaxEnt模型的输入数据。
1.2 环境变量数据收集及处理
环境变量共有37个,包括19个气候变量、17个土壤变量和1个海拔变量,其中气候变量获取自全球气候数据库网站(版本WorldClim2.0,分辨率为2.5 min);土壤变量和海拔变量获取自世界土壤数据库(版本HWSD1.2,分辨率为30 s);利用Arcgis10.8软件将环境数据调整为统一格式和分辨率。利用Pearson相关性分析考察各变量之间的相关性,保留相关系数小于0.8的变量,对相关系数大于0.8的变量保留一个具有重要指示意义的环境变量。
1.3 模型建立、优化和评估
本研究采用R语言软件的Kuenm语言包来优化参与MaxEnt建模的模型[17],优化过程中设置40个调控倍频(RM = 0.1~4),依次与MaxEnt软件中5种特征进行排列组合,选择程序推荐最优参数建模[16]。
1.4 最大熵模型构建与评估
将筛选后的双角草分布数据与环境因子导入MaxEnt软件中进行模拟,随机选取75%的分布数据用于训练模型用于分布预测,其余25%分布数据用于后续验证模型,设置模型重复运行10次。用受试者工作特征(Receiver Operating Characteristic Curve,ROC)和曲线下面积(Area Under the Cure,AUC)来评价模型预测结果[18-19]。
1.5 适生区划分与主导环境变量分析
利用Arcgis10.8重分类工具进行适生区划分。主导环境变量根据刀切法检验、贡献率和置换重要值确定,利用主导环境变量中的响应曲线计算适生阈值。
2 结果与分析
2.1 环境变量筛选
利用ArcGIS软件提取37个环境变量相应危害点的数据,使用SPSS软件进行Pearson相关性分析,如图1所示;共筛选出24个环境变量,见表1。
表1 环境变量
Table 1 Environment Variables
变量代码 | 中文名称 | 单位 |
BIO 1 | 年平均气温 | ℃ |
BIO 2 | 平均气温日较差 | ℃ |
BIO 3 | 等温性 | % |
BIO 5 | 最热月份最高温 | ℃ |
BIO 8 | 最湿季度平均温度 | ℃ |
BIO 9 | 最干季度平均温度 | ℃ |
BIO 12 | 年降水量 | mm |
BIO 15 | 降水量季节性变化 | mm |
BIO 16 | 最湿季度降水量 | mm |
BIO 17 | 最干季度降水量 | mm |
ELEVATION | 海拔 | m |
T_GRAVEL | 碎石体积百分比 | % |
T_SAND | 沙含量 | % |
T_SILT | 淤泥含量 | % |
T_CLAY | 粘土含量 | % |
T_BULK_DENSITY | 土壤容重 | kg/dm3 |
T_OC | 有机碳含量 | % |
T_PH_H2O | 酸碱度 | -log (H+) |
T_CEC_CLAY | 黏性层土壤的阳离子交换能力 | cmol/kg |
T_CEC_SOIL | 土壤的阳离子交换能力 | cmol/kg |
T_CACO3 | 碳酸盐或石灰含量 | % |
T_CASO4 | 硫酸盐含量 | % |
T_ESP | 可交换钠盐 | % |
T_ECE | 电导率 | dS/m |
2.2 模型优化结果
本研究使用Kuenm包,利用40个调控倍频和5种特征类型进行排列组合共创建1160个分布模型,程序推荐1个最优模型符合5%数据遗漏率和AICc值自然对数最低标准,如图2所示。最优模型pROC = 0.5%,数据遗漏率(Omission rate at 5%)= 0.0497、AICc = 43702.8328、delta AICc = 0,优化模型参数FC = LQPTH、RM = 0.3。
图2 所有候选模型的遗漏率与AICc值自然对数
Fig.2 Omission rates and natural logarithm of AICc values for all candidate models
2.3 Maxent模型的准确性评估
将双角草分布数据与筛选环境变量导入MaxEnt软件中,使用最优模型参数并重复运行10次,通过MaxEnt软件中的ROC曲线和遗漏率对预测模型进行检验,如图3所示,结果显示平均AUC = 0.9091,其中训练数据AUC值在0.9124~0.9125之间,平均值为0.9124;测试数据AUC值在0.9045~0.9159之间,平均值为0.9091。
图3 MaxEnt模型的ROC检验
Fig.3 ROC test of the MaxEnt model
2.4 影响双角草适生区分布的关键环境因子及适生阈值
刀切法检验结果表明(图4),正则化训练增益前8个环境变量依次为:最干季度降水量、年降水量、年平均气温、最湿季度降水量、等温性、有机碳含量、降水量季节性变化;测试增益由高到低前8个环境变量依次为:最干季度降水量、年降水量、年平均气温、最湿季度降水量、有机碳含量、等温性、最热月份最高温度;AUC值由高到低前8个环境变量依次为最干季度降水量、年降水量、年平均气温、有机碳含量、最湿季度降水量、等温性、黏性层土壤的阳离子交换能力、沙含量;贡献率(表2)前5的变量依次为:最干季度降水量、等温性、年平均气温、最热月份最高温度、碎石体积百分比;在表2中置换重要值前5的变量依次为:最干季度降水量、等温性、最热月份最高温度、最湿季度降水量、年平均气温。
综合以上分析结果,得出年最干季度降水量、年降水量、年平均气温、最湿季度降水量、等温性、最热月份最高温度、碎石体积百分比是影响双角草潜在适生区分布的主导因素,适生阈值分别为:最干季度降水量115~470 mm、年降水量790~2260 mm、年平均气温10~24℃、最湿季度降水量255~670 mm、等温性27.0%~55.5%、最热月份最高温度27~36℃、碎石体积百分比35%~50%。
2.5 双角草适生等级划分
利用MaxEnt软件所生成数据分组,使用自然间断点分级法划分双角草的4类适生区(表3),统计不同等级适生区分布面积。
表3 适生性等级划分标准
Table 3 Classification criteria for suitability levels
适生区 | 适生值 | 适生性 |
非适生区 | 0<适生值≤0.058 | 不适宜双角草生存 |
低度适生区 | 0.058<适生值≤0.174 | 基本适宜双角草生存 |
中度适生区 | 0.174<适生值≤0.324 | 较适宜双角草生存 |
高度适生区 | 适生值>0.324 | 很适宜双角草生存 |
2.6 双角草在我国的潜在适生区分布
双角草在我国的潜在适生区面积总计为95.57万km2,约占国土总面积的9.96%,适生区相对集中,主要分布在我国东南低山丘陵平原地区[20],如表4所示。双角草高适生区面积6.38万km2,集中分布在福建、浙江、江西大部,湖北东部、安徽西南部、湖南西部、广东南部沿海地区、中国台湾北部及西南部沿海地区;中适生区面积26.54万km2,集中分布在广东、广西、福建、浙江、江西、湖南大部,湖北、安徽、江苏、上海、中国台湾局部地区;低适生区面积62.65万km2,集中分布在广东、福建、广西、湖南、安徽、湖北、上海大部,江苏、河南、重庆、贵州、云南、西藏地区。
3 结论
3.1 模型的准确性
本研究利用筛选后的24个环境变量,在优化模型参数的基础上,对双角草在中国的适宜区进行预测,优化后模型的遗漏率= 0.0497、delta AICc = 0、AUC = 0.9091>0.9,表明模拟结果采信度高。
3.2 关键环境变量
综合Jackknife检验、贡献率和置换重要值分析结果,最干季度降水量、年降水量、年平均气温、最湿季度降水量、等温性、最热月份最高温度、碎石体积百分比等变量为主导变量,其中降水量、等温性、年平均气温、最热月份最高温度贡献率共计93.2%,而所有土壤环境变量的贡献率仅为3.7%,海拔变量的贡献率仅为0.1%。结果表明,气候为双角草适生分布的主要因素,其次为土壤和海拔因素。此外,世界土壤数据库中土壤环境变量共有34种,其中17种为地表至地下30 m,其余17种为地下30~100 m,考虑到双角草为草本植物,与根系较深的木本植物相比,其根系相对较浅,地下30~100 m的土壤变量对其影响较小,因此本研究并未采用地下30~100 m土壤变量参与模型构建。
3.3 双角草适生环境和适生区域
双角草的典型栖息地包括湿地、沟渠以及周期性淹没的地区。光照水平对其影响不高,沙质土壤类型更适合其生存,如沙子、沙质壤土和沙质泥炭。在北美地区,双角草广泛分布于草原、平原森林、沙洲、沼泽林地、湿地等。从影响双角草分布的主导环境变量来看,最湿季度降水量、年降水量、年平均气温、最干季度降水量、等温性、最热月份最高温度主要与温度和降水相关。本研究推算出双角草最宜适生区7个主要环境变量适生区间分别为:最干季度降水量115~470 mm、年降水量790~2260 mm、年平均气温10~24℃、最湿季度降水量255~670 mm、等温性27.0%~55.5%、最热月份最高温度27~36℃、碎石体积百分比35%~50%,上述环境条件与双角草实际分布区域气候环境条件基本吻合。根据模型预测结果显示,双角草在我国潜在适生区面积总计为95.57万km2,约占国土总面积的9.96%,适生区相对集中且主要分布在我国东南低山丘陵平原地区,范围涵盖安徽、江西、湖北、湖南、福建、广东、广西、中国台湾。对比双角草在中国采集地信息,中国台湾新竹,安徽芜湖、六安和宣城,广西富川均在双角草适生区域内,其中,中国台湾新竹、安徽六安在高适生区,安徽芜湖和宣城、广西富川在中适生区,上述标本采集地与适生区域预测结果基本一致。
4 讨论
外来有害生物风险分析主要包含风险分析的起始、风险评估和风险管理三个方面的内容[21],其中风险评估的核心内容为有害生物的适生性分析,这是有害生物造成环境、生态、经济影响的首要前提。一直以来,适生性分析多以有害生物适生环境(如气候、植被、土壤、水文)作为评价指标,对比有害生物风险分析地区的相应环境做出适生性评价,需要较高的人力和时间成本的投入。随着技术的不断发展,植物检疫工作者也在寻求利用更为科学和量化的方法开展有害生物适生性分析,因MaxEnt软件开源性及气候变量相对易于获取,其在适生性分析中得到越来越多的应用。
利用数字化资源开展适生性预测是有害生物风险分析的发展趋势。MaxEnt模型进行适生性分析的方法虽使用广泛,但仍有需要改进和优化的方面,如环境变量一致性、软件使用的简便性等。目前适生性分析研究多以气候变量为主,建模环境变量相对单一,笔者认为环境变量的分辨率、地形地貌、植被覆盖、寄主分布、人类活动痕迹也是影响预测结果准确性的重要因素。对于有害生物风险分析工作而言,不同类别的有害生物所参考的适生性因素也有所不同。随着大数据、云计算等技术的不断发展,在此基础上建立一个统一的、可量化、标准化的风险分析平台,对于简化风险分析流程、提高风险分析效率具有重要意义。
本研究通过基于R语言优化的MaxEnt模型预测双角草在中国的适生区域和适生环境,结果表明其具有潜在的广泛分布区域和较强的适生能力,故应引起高度关注,同时也为有关部门对该杂草制定检疫和防控措施提供参考。
参考文献
[1] 罗献瑞. 中国植物志[M]. 北京: 科学出版社, 1999: 205.
[2] HSIEH C F, CHAW S M. Diodia virginiana L. (Rubiaceae) in Hsinchu: new to Taiwan[J]. Botanical Bulletin Of Academia Sinica, 1987, 28: 43-48.
[3] 李中林, 洪欣, 刘坤, 等. 中国大陆茜草科一新归化种——双角草[J]. 安徽师范大学学报(自然科学版), 2014, 37(5): 475-476.
[4] 农素芸, 陆昭岑, 陈海玲, 等. 广西维管植物五新记录属[J]. 广西植物, 2023, 43(12): 2196-2202.
图1 37个变量间的相关性热图
Fig.1 Heat Map of Correlations Among 37 variables
图4 环境变量的刀切法检验图
Fig.4 Jackknife test of the environment variables
表2 贡献率和置换重要值
Table 2 Contribution rate and permutation importance value
变量名称 | 贡献率 (%) | 置换重要性 (%) | 变量名称 | 贡献率 (%) | 置换重要性 (%) |
BIO 17 | 63.1 | 42.7 | T_CASO4 | 0.2 | 2.1 |
BIO 3 | 11.9 | 10.8 | BIO 15 | 0.1 | 1.7 |
BIO 1 | 10.3 | 3.5 | T_CACO3 | 0.1 | 1.0 |
BIO 5 | 7.9 | 14.0 | T_OC | 0.1 | 2.1 |
T_GRAVEL | 2.4 | 1.4 | ELEVATION | 0.1 | 0.9 |
BIO 16 | 1.2 | 4.0 | T_PH_H2O | 0 | 0.3 |
BIO 2 | 0.8 | 2.6 | BIO 8 | 0 | 0.5 |
BIO 12 | 0.7 | 3.5 | T_CEC_SOIL | 0 | 0.2 |
T_ECE | 0.4 | 3.4 | T_SILT | 0 | 0 |
BIO 9 | 0.3 | 3.0 | T_ESP | 0 | 0 |
T_BULK_DENSITY | 0.2 | 0.9 | T_CLAY | 0 | 0 |
T_CEC_CLAY | 0.2 | 1.4 | T_SAND | 0 | 0 |
表4 双角草在我国潜在适生区分布
Table 4 Potential suitable area of Diodia virginiana in China
适生区 | 省 | 市/州 |
高适生区 | 安徽、湖北、湖南、江西、浙江、福建、广东、广西、中国台湾 | 梅州、河源、云浮、阳江、江门、中山、贵港、中国台湾北部及东部沿海地区 |
中适生区 | 安徽、湖北、湖南、江西、浙江、福建、广东、广西、上海、江苏、贵州、中国台湾 | 黔东南、黔西南、中国台湾北部、东部、南部地区 |
低适生区 | 安徽、湖北、湖南、福建、广东、江苏、贵州、河南、重庆、云南、西藏 | 南通、盐城、扬州、镇江、泰州、黔南、安顺、贵州、遵义、铜仁、驻马店、信阳、宝山、大理、曲靖、西双版纳州、林芝 |