叶绿素是绿色植物吸收光能的重要物质,直接影响到植物光合作用的效能与水平,其含量对植物光合能力、发育以及生长状况具有指示作用,是生态系统活力的重要体现[1-2]。叶绿素也是叶片中的重要含氮物质,其含量反映了植物氮素的吸收和利用状况,叶片叶绿素含量的测量值能间接、精确地评估植被的营养状态[3],同时也能够对植被病害进行诊断[4]。健康绿色植被在可见光范围内的光谱反射率主要受叶绿素含量的影响,而其在近红外波段主要与叶片结构、叶片纤维等因素有关[5]。近年来,随着高光谱技术的不断发展,国内外研究学者通过光谱反射技术快速、定量、无损地对植被叶绿素含量开展检测研究,如梁爽等[6]通过对苹果树叶片光谱和叶绿素含量开展相关性及回归分析,得出一阶微分521和523 nm组合的估测模型拟合精度最高;金震宇等[7]对水稻叶片叶绿素浓度和相应的光谱反射率数据进行相关分析,结果显示水稻叶片的“红边”拐点波长位置与其叶绿素浓度之间具有很强的相关性。这些研究说明,不同植被或者农作物用以构建叶绿素含量估算模型的光谱参数有较大区别。在构建叶绿素含量检测模型方面,前人所采用的方法也有较大差异,如郭啸川等[8]利用连续统去除法提取特征变量,结果表明以BNA617为变量建立的光谱参量模型最好;王强等[9]采用线性及多元逐步回归技术构建了棉花冠层叶绿素密度高光谱诊断模型;姚付启等[10]基于主成分分析构建了适宜法国梧桐的叶绿素含量高光谱反演模型。
以上研究表明,对于不同的植被或作物,其叶绿素含量的估算具有独特性,难以构建一套通用的方法,且目前研究主要集中在玉米、水稻、棉花等均一化较明显,具有共性特性的农作物,而对于甜柚Citrus maxima cv.Tian这样的具有典型南方地域特色果树的叶绿素含量检测模型鲜有研究[11]。南康甜柚清香、酸甜、凉润,营养丰富,药用价值很高,是人们喜食的名贵水果之一,同时也是南方地区农民们大量种植的果树品种。随着甜柚的大量种植,也出现较多的疾病,常见的有脚瘸病、流胶病等,以致黄叶枯枝,树势衰弱,甚至整株枯死,严重影响了甜柚的产量。本文以赣州南康甜柚为例,通过高光谱遥感技术,比较单变量回归、逐步回归及偏最小二乘法(PLS)的适用性,构建适合甜柚叶片叶绿素含量高光谱无损检测模型,旨在为甜柚叶绿素含量的估算提供方法和参考,对大面积的甜柚营养诊断及病害检测提供依据。
1 材料与方法 1.1 试验设计与数据采集试验地点位于赣州市南康区的一片甜柚果园内,使用由美国ASD公司生产的Field Spec4便携式地物光谱仪测定甜柚叶片的光谱分辨率,其光谱测量范围为350~2 500 nm,其中,光谱分辨率为3 nm,采样间隔为1.4 nm (350~1 000 nm);光谱分辨率为10 nm,采样间隔为2 nm (1 000~2 500 nm)。仪器探头垂直向下,距离采集样本的垂直距离为10~15 cm,采集数据前需经过白板校正和优化操作,光谱仪视场角选用10°。
试验时间为2017年4月,采集样本选择在晴朗无云无风的11:00—14:00,采样样本均匀分布在不同果园,有较大的空间区域范围,使其具有代表性,共采集50组样本,其中,经过光谱预处理后合格光谱为40组,随机选取20组作为试验样本,剩余20组作为精度验证样本。为减少由疾病影响所导致的试验误差,供试品种均为自然状态下长势良好的甜柚树叶,为了降低测量误差,均匀选取每株甜柚树各部位的叶片,对每片叶的叶尖、叶中、叶基位置各测2次共6组光谱数据,该叶片的反射光谱值为这6组数据的平均值。
采集光谱数据后,使用SPAD-502叶绿素仪进行甜柚叶片叶绿素含量的测定,相关研究表明叶绿素含量与该仪器测定的SPAD值之间呈极显著相关关系,可以代表叶绿素含量,且对植被没有危害性[12-13],因此本文采用该仪器测定值来代替叶绿素含量。测量时,每片叶子应避开叶脉,采集多次数据取平均值作为该叶片的叶绿素含量。
1.2 数据处理与模型构建使用ViewSpecPro软件进行光谱曲线的相关预处理,选择达到极显著相关水平的敏感波段的光谱参数与甜柚叶绿素含量建立单变量及多元逐步回归估算模型;通过Unscrambler 9.7软件利用预处理后的光谱数据与甜柚叶绿素含量建立偏最小二乘模型。
1.2.1 光谱反射率一阶导数法光谱微分技术包括对反射光谱进行数学模拟和计算不同阶数的微分值以迅速确定光谱弯曲点及最大最小反射的波长位置[14]。对于植被叶片而言,光谱数据的一阶导数有利于消除部分大气、土壤背景等低频光谱成分对目标的影响来突出目标,反映和揭示光谱的内在特性[15],本文采用光谱一阶导数方法对甜柚叶片光谱数据进行处理,其公式如下:
$ R{_i^{'}}{\rm{ = }}\frac{{{R_{i + 1}} - {R_{i - 1}}}}{{{\lambda _{i + 1}} - {\lambda _{i - 1}}}} = \frac{{{R_{i + 1}} - {R_{i - 1}}}}{{2\Delta \lambda }}, $ | (1) |
式中,
皮尔逊(Pearson)系数法是一种反映2种变量线性相关程度的方法,利用该方法分析叶绿素含量和各光谱参数之间的相关性,其公式为:
$ {r_{xy}} = \frac{{\displaystyle\sum\limits_{i = 1}^n {({x_i} - \bar x)({y_i} - \bar y} )}}{{\sqrt {\displaystyle\sum\limits_{i = 1}^n {{{({x_i} - \bar x)}^2}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - \bar y)}^2}} } } }}, $ | (2) |
式中,rxy表示叶绿素含量与各光谱参数的相关系数,n表示样本数量,xi表示第i个样本的光谱参数值,yi为第i个样本的叶绿素含量,
以通过相关性分析达到极显著相关水平的光谱参数为回归方程的自变量(x),甜柚叶绿素含量为因变量(y),进行简单回归拟合分析,构建单变量回归分析模型[16],具体模型公式如下:
$ {\text{指数模型:}}\;\; y = a \times \exp (bx),\;\; $ | (3) |
$ \;\;{\text{线性模型:}}\;\; y = bx + a, \quad\quad\quad\;$ | (4) |
$ \;\,{\text{抛物线模型:}}\;\; y = c{^2} + bx + a, $ | (5) |
式中,a、b、c均为系数。
1.2.4 逐步回归分析法逐步回归方法从一个自变量开始,视自变量y作用的显著程度,从大到小依次逐个引入回归方程,但当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除,并引入一个自变量或从回归方程中剔除一个自变量,称为逐步回归的一步,对于每一步都要进行y值检验,以确保每次引入新的显著性变量前回归方程中只包含对y作用显著的变量,这个过程反复进行,直至把不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止[17]。
本文通过相关性分析首先筛选出对甜柚叶绿素含量影响显著的光谱参数,进而对每个参数进行假设检验,从而剔除影响不显著的光谱参数并重新建立不包含该参数的回归分析模型,最后筛选出最有影响的光谱参数,建立最佳回归模型,具体公式如下:
$ y = a_0 + {a_{1}}{x_{1}} + {a_{2}}{x_{2}} + \cdots+ {a_{i}}{x_{i}}, $ | (6) |
式中,y为甜柚叶绿素含量,xi为保留下来的各光谱参数,ai为回归系数。
1.2.5 偏最小二乘法偏最小二乘法提供一种多对多线性回归建模的方法,特别是当2组变量的个数很多,且都存在多重相关性,而观测的样本数据又较少时,偏最小二乘法建立的模型较传统经典回归分析更为精确,且它在建模过程中集中了主成分分析、典型相关性分析和线性回归分析的特点,因此在分析结果中,还可以完成一些类似于主成分分析和典型相关分析的内容,提供更为丰富的信息[18]。
其基本原理为:测定n个样本,每个样本含有p个因变量X和q个自变量Y,偏最小二乘法就是综合分析n个样本中的全部因变量和自变量,提取出主成分t和u,其中主成分t、u分别最大程度地表示因变量和自变量的变异信息,在第1个成分t1和u1被提取后,分别实施X对t1的回归及Y对u1的回归,如果回归方程已经达到满意的程度,则算法终止,否则,进行第2次的成分提取,若对自变量提取了m个成分(t1,t2,…,tm),偏最小二乘法将建立yk对t1,t2,…,tm的回归,然后再表达成yk对原变量x1,x2,…,xm的回归方程(k=1,2,…,q)[19]。
1.3 精度验证本研究的模型精度检验采用相关系数(r),均方根误差(RMSE)及相对误差(RE)这3个指标。R越接近于1,且RMSE与RE值最小,则表明所建立的模型拟合效果越好,精度越高。其计算公式如下:
$ {\rm{RMSE}} = \sqrt {\frac{{\displaystyle\sum\limits_{i = 1}^n {{{({{\hat y}_i} - {y_i})}^2}} }}{n}} , $ | (7) |
$ {\rm{RE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\frac{{\left| {{{\hat y}_i} - {y_i}} \right|}}{{{y_i}}}} \times 100\text{%} , $ | (8) |
式中,
植被光谱曲线形态主要受2个因素影响,一是其具有基本的、独特的光谱曲线形态,利用该曲线形态可以判别是否属于植被的光谱特征;二是由于外界因素影响其生长发育,从而反映在结构特征上,并在光谱曲线的形态中表现出来。图1是一般健康植被与实测南康甜柚叶片原始光谱曲线的比较,图中实测的甜柚原始光谱曲线是经过去噪及水汽处理的,所以波段1 350~1 450、1 750~1 950、2 350~2 500 nm的曲线被剔除。剔除后的实测植被还是具有一般植被的光谱曲线形态:
![]() |
图 1 一般植被和甜柚叶片的光谱曲线 Fig. 1 The spectral curves of general leaf spectra and Citrus maxima leaves |
在可见光波段(400~760 nm)范围内,植被光谱曲线主要受叶绿素等色素的强吸收影响,光谱反射率普遍较低,反射率一般不超过0.2,由于植被进行光合作用的影响,在450 nm的蓝光波段和670 nm的红光波段强吸收,形成向下凹陷的蓝光吸收谷和红光吸收谷,而在中心波长为550 nm的绿光波段由于强反射作用形成一个向上凸起的反射峰。另外,在670~760 nm波段范围内,由于植被叶片内部结构的相互影响,光谱反射率随着波长的增加呈现急剧上升的形势,这是植被光谱曲线最为明显的特征“红边”现象,反射率可达到0.4以上。
在近红外波段(780~2 500 nm)范围内,光谱反射率明显较可见光波段反射率高。由于进入叶片细胞内部的光线产生多次物理折射和反射作用,在960和1 180 nm附近产生2个吸收谷,是因氧气或水的窄吸收,使得该波段范围的光谱曲线呈现“波浪”的形态;在1 300~2 500 nm波段范围内,光谱反射率曲线迅速下降,这是植物叶片含水量使光谱的吸收率增加,反射率降低的缘故,尤其在1 450和1 900 nm附近产生水吸收带,形成向下凹陷的低谷,由于实测的植被光谱数据在这一部分存在明显的噪声影响,因此去除了这一部分的光谱曲线。
2.2 甜柚叶片叶绿素含量与光谱反射率的相关性甜柚叶片原始和一阶导数光谱与其叶绿素含量的相关性如图2所示。
由图2a可知,甜柚叶片叶绿素含量与原始光谱反射率基本上呈负相关,仅在波段859~934和959~1 000 nm呈正相关,且相关性很低。在波段515~632和693~715 nm达到了显著负相关水平(P<0.05),其中,在波段535~566和701~704 nm达到了极显著负相关水平(P<0.01),敏感波段发生在553 nm,相关系数为 −0.568 4。
甜柚叶片叶绿素与一阶光谱反射率的相关性如图2b所示,通过分析可知,在波段373~392、443~458、470~539和678~702 nm达到了显著负相关水平(P<0.05),其中,在波段384~391、449~453、476~537和679~701 nm达到了极显著负相关水平(P<0.01),敏感波段发生在692 nm,相关系数为–0.828 7。在波段401~429、557~672和713~757 nm达到了显著正相关水平(P<0.05),其中,在波段403~418、425~429、563~671和719~756 nm达到了极显著正相关水平(P<0.01),敏感波段发生在752 nm,相关系数为0.890 3。在波段775~1 000 nm区间其相关性变化无明显正负规律,因此不做研究。
![]() |
图 2 甜柚叶片叶绿素含量与原始光谱(a)及一阶光谱(b)反射率的相关性 Fig. 2 Correlation of chlorophyll content in Citrus maxima leaves with the original spectral reflectance (a) and first order spectral reflectance (b) |
为了求得精确的结果,根据上文对甜柚叶片叶绿素含量与原始光谱和一阶光谱的相关性分析,选择达到极显著相关水平的3个敏感波段的光谱参数作为自变量(R553 nm、R692 nm和R752 nm),其相应的叶绿素含量作为因变量(y)建立单变量估算模型,其精度分析结果如表1所示。以一阶导数752 nm为自变量的模型精度较原始光谱553 nm和一阶导数692 nm好,其中,以一阶导数752 nm的指数模型精度最好,r2为0.800。
![]() |
表 1 甜柚叶片叶绿素含量的单变量估算模型决定系数(r2)1) Table 1 Determination coefficient (r2) of single variable estimation model of chlorophyll content in Citrus maxima leaves |
根据甜柚叶片叶绿素含量与光谱反射率相关性分析的结果,从中选出相关系数较大,分布均匀的波长553、692、752、712、683、423、527 nm的光谱参数作为逐步回归的自变量,相应的SPAD值作为因变量建立多元逐步回归模型,结果见表2。从表2中可以看出,以入选变量一阶导数光谱(752、683 nm)参数所建立的逐步回归模型精度较以原始光谱(553、712 nm)参数所建立的模型好,决定系数r2达到0.815。
![]() |
表 2 甜柚叶片叶绿素含量的多元回归分析模型决定系数(r2) Table 2 Determination coefficient (r2) of multivariate regression analysis model of chlorophyll content in Citrus maxima leaves |
尝试利用甜柚叶片高光谱数据结合偏最小二乘法进行甜柚叶片叶绿素含量估测,使用Unscrambler软件处理原始光谱波段数据和叶绿素含量数据,由于植物色素(叶绿素和类胡萝卜素)对植被和叶片反射光谱的影响主要体现在可见光波段,因此数据分析使用的是350~1 000 nm波段,然后进行PLS建模,模型的稳定性和拟合效果通过交互验证的方法检验,最佳主成分个数也由交互验证法确定。
各成分对应的特征值及相关系数如表3所示,前4个主成分累计解释了自变量(X) 99.05%和因变量(Y) 86.23%的信息,这4个主成分具备较强的解释能力,因此最佳主成分个数为4,且这4个主成分与甜柚叶绿素含量均达到极显著相关水平,表明所提取的主成分能够准确地反映原始数据的信息。
![]() |
表 3 前4个主成分对甜柚叶绿素含量的影响1) Table 3 Influences of the first four principal components on chlorophyll contents in Citrus maxima leaves |
在确定4个主成分的基础上建立PLS模型,此模型具有较高的精度,决定系数r2为0.869,RMSE和RE分别为3.013和6.82%,通过交互验证法发现,实测值与预测值具有较好的对应关系,结果如图3所示。
![]() |
图 3 叶绿素含量PLS模型实测值与生成预测值对比 Fig. 3 Comparison between the measured values and prediction values of PLS model on chlorophyll content |
采用剩余20个样本对上述建立的叶绿素估算模型进行精度验证,结果如表4所示。在建立的6种估算模型中,以PLS模型最优,其决定系数r2最高,为0.932,RMSE和RE均最小,分别为2.310和3.41%。其他模型也能够对甜柚叶片叶绿素含量进行估算,但精度均不如PLS模型。
![]() |
表 4 不同叶绿素含量估算模型精度分析 Table 4 Accuracy analysis of different chlorophyll content estimation models |
![]() |
图 4 基于PLS模型实测值与预测值分布图 Fig. 4 Distribution map of the measured values and predicted values of PLS model |
对南康甜柚叶片叶绿素含量与高光谱特征参数的相关分析表明,PLS模型通过提取与自变量和因变量相关程度最大的主成分而能够最大限度地反映原始数据的信息,建立的模型能达到较高精度,它比逐步回归和单个光谱特征参数构建的估算模型效果好,其原因主要是PLS模型包含整个波段信息,波段信息的叠加使得建模精度较高,而逐步回归尽管引入多个建模变量,却较容易舍弃与叶绿素含量相关程度较高的特征变量,单个波段也不一定能完全反映与叶绿素含量的相关关系,但PLS模型能够充分利用光谱中的信息弥补这一缺点。本文通过建立单变量回归、逐步回归及PLS模型进行甜柚叶绿素含量的测定,研究结果表明,利用偏最小二乘法所构建的叶绿素含量估算模型具有最佳预测精度,这与一些学者的研究结果相类似[20]。但是影响模型精度的敏感波段不同,这可能与不同植被叶片结构也不太相似有关系。本试验主要对南康甜柚叶绿素含量进行高光谱遥感估算,表明利用PLS模型预测甜柚叶绿素含量是可行的,对于不同的植被以及相同植被不同物候期或者不同部位如何建立更高精度的模型,仍然需要进一步探索和研究。
本文通过测得的甜柚叶片光谱曲线和叶绿素含量值,通过对其光谱曲线的分析,综合考虑了单变量回归、逐步回归及偏最小二乘法估测叶绿素含量的方法,构建甜柚叶绿素含量估算模型并进行了精度评价分析,经研究得出如下结论:
甜柚叶绿素含量与原始光谱及一阶导数光谱曲线的相关性分析得出,原始光谱在553 nm处的反射率、一阶光谱在692和752 nm处的反射率与叶绿素含量达到了极显著相关水平,且相关系数最高,这3个波段为甜柚叶片光谱反射率敏感波段。
基于对甜柚叶片的光谱及叶绿素数据分析,经精度验证发现,利用偏最小二乘回归技术建立的模型其精度最高,误差较小,适宜作为估测甜柚叶片叶绿素含量的检测模型,对于实现其大面积无损的遥感长势监测有借鉴意义。
[1] |
SUN H, Li M Z, ZHENG L H. Monitoring of maize chlorophyll content based on multispectral vegetation indices[C]//Proceedings Volume 8527: Multispectral, Hyperspectral and Ultraspectral Remote Sensing Technology, Techniques and Applications IV: 852711. Kyoto, Japan: SPIE Asia-Pacific Remote Sensing, 2012. doi:10.1117/12.977414.
( ![]() |
[2] |
OKUDA K, TANIGUCHI K, MIURA M, et al. Application of vegetation isoline equations for simultaneous retrieval of leaf area index and leaf chlorophyll content using reflectance of red edge band[C]// Proceedings Volume 9975:Remote Sensing and Modeling of Ecosystems for Sustainability XIII: 99750C . San Diego, California, United States: SPIE Optical Engineering and Applications, 2016. doi:10.1117/12.2236811.
( ![]() |
[3] |
郭洋洋, 张连蓬, 王德高, 等. 小波分析在植物叶绿素高光谱遥感反演中的应用[J]. 测绘通报, 2010, 35(8): 31-33. ( ![]() |
[4] |
王静, 景元书, 黄文江, 等. 冬小麦条锈病严重度不同估算方法对比研究[J]. 光谱学与光谱分析, 2015, 35(6): 1649-1653. DOI:10.3964/j.issn.1000-0593(2015)06-1649-05 ( ![]() |
[5] |
李欢. 基于高光谱数据的柑桔叶绿素含量估算研究[D]. 重庆: 西南大学, 2009.
( ![]() |
[6] |
梁爽, 赵庚星, 朱西存. 苹果树叶片叶绿素含量高光谱估测模型研究[J]. 光谱学与光谱分析, 2012, 32(5): 1367-1370. DOI:10.3964/j.issn.1000-0593(2012)05-1367-04 ( ![]() |
[7] |
金震宇, 田庆久, 惠凤鸣, 等. 水稻叶绿素浓度与光谱反射率关系研究[J]. 遥感技术与应用, 2003, 18(3): 134-137. DOI:10.3969/j.issn.1004-0323.2003.03.003 ( ![]() |
[8] |
郭啸川, 罗丽娟, 陈文惠, 等. 基于连续统去除法的湿地松叶绿素含量高光谱估算模型[J]. 吉林师范大学学报(自然科学版), 2012, 33(4): 95-101. ( ![]() |
[9] |
王强, 易秋香, 包安明, 等. 基于高光谱反射率的棉花冠层叶绿素密度估算[J]. 农业工程学报, 2012, 28(15): 125-132. ( ![]() |
[10] |
姚付启, 张振华, 杨润亚, 等. 基于主成分分析和BP神经网络的法国梧桐叶绿素含量高光谱反演研究[J]. 测绘科学, 2010, 35(1): 109-112. ( ![]() |
[11] |
岳学军, 全东平, 洪添胜, 等. 柑橘叶片叶绿素含量高光谱无损检测模型[J]. 农业工程学报, 2015, 31(1): 294-302. DOI:10.3969/j.issn.1002-6819.2015.01.039 ( ![]() |
[12] |
姜丽芬, 石福臣, 王化田, 等. 叶绿素计SPAD-502在林业上应用[J]. 生态学杂志, 2005, 24(12): 1543-1548. DOI:10.3321/j.issn:1000-4890.2005.12.034 ( ![]() |
[13] |
DIAN Y Y, LE Y, FANG S H, et al. Influence of spectral bandwidth and position on chlorophyll content retrieval at leaf and canopy levels[J]. J Indian Soc Remote Sens, 2016, 44(4): 1-11. ( ![]() |
[14] |
PU R L, GONG P. Hyperspectral remote sensing and its applications[M]. Beijing: Higher Education Press, 2000: 81-97.
( ![]() |
[15] |
姚付启, 蔡焕杰, 王海江, 等. 冬小麦冠层高光谱特征与覆盖度相关性研究[J]. 农业机械学报, 2012, 43(7): 156-162. DOI:10.6041/j.issn.1000-1298.2012.07.029 ( ![]() |
[16] |
谭琨, 叶元元, 杜培军. 基于支持向量机的假酒近红外光谱识别分类研究[J]. 光子学报, 2013, 42(1): 69-73. ( ![]() |
[17] |
游士兵, 严研. 逐步回归分析法及其应用[J]. 统计与决策, 2017, 20(14): 31-35. ( ![]() |
[18] |
罗批, 郭继昌, 李锵, 等. 基于偏最小二乘回归建模的探讨[J]. 天津大学学报(自然科学与工程技术版), 2002, 35(6): 783-786. ( ![]() |
[19] |
刘忠华, 李云梅, 吕恒, 等. 基于偏最小二乘法的巢湖悬浮物浓度反演[J]. 湖泊科学, 2011, 23(3): 357-365. ( ![]() |
[20] |
褚武道, 陈文惠, 艾金泉, 等. 基于偏最小二乘法的樟树叶片叶绿素含量高光谱估算[J]. 福建师范大学学报(自然科学版), 2014, 30(1): 65-70. ( ![]() |