史文娇等在大尺度土壤粒径空间插值和土壤质地分类方面取得新进展

土壤质地是影响土壤性质的最重要属性之一,土壤粒径是众多土壤、水文、生态系统和环境评估等大型陆表过程模型中的关键参数。在大尺度范围内,提高其空间预测精度有助于更好的理解土壤物理、水文、生态和环境等过程机制。系统比较五种机器学习模型结合土壤粒径原始数据及三种对数比转换数据在土壤粒径插值和土壤质地分类中精度验证、空间制图和不确定性分析等方面的表现,可为基于机器学习模型和偏态分布数据在大尺度土壤粒径空间预测研究提供参考。

近期,史文娇等使用五种机器学习模型——K最近邻(KNN)、多层感知器神经网络(MLP)、随机森林(RF)、支持向量机(SVM)和极端梯度提升树(XGB),结合原始数据、加性对数比(ALR)、中心对数比(CLR)和等距对数比(ILR)三种对数比转换数据方法,对黑河流域进行土壤粒径插值和土壤质地分类的系统比较。

结果表明,对数比转换方法降低了土壤粒径数据的偏度。在土壤质地分类方面,RFXGB,具有较高的总体精度和Kappa系数。根据精度-召回率曲线下面积(AUPRC)分析,可对类别不均衡数据进行分类能力的评价。对于土壤粒径插值,RF具有最优的均方根误差(RMSE)、平均绝对误差(MAE)、Spearman相关系数(RCC)、Aitchison距离(AD)和标准化残差平方和(STRESS)。使用对数比转换方法(尤其是CLRILR)可以改善STRESS。直接分类法和间接分类法的空间预测图在黑河流域上游和中游的细节表现较为类似,而利用对数比转换方法的间接分类图在下游具有更多的细节信息。土壤质地的间接分类法与直接分类法相比,Kappa系数提高了21.3%

综上,根据土壤粒径插值和土壤质地分类的精度评价, RF是五种机器学习模型中的最佳模型;考虑到成分数据的约束性,推荐ILR方法结合机器学习模型;若考虑模型精度和模型计算时间的权衡,更推荐XGB模型。

论文第一作者为中科院地理资源研究所客座研究生张沫,通讯作者为史文娇。相关研究成果发表在地学一区TOP期刊《HYDROLOGY AND EARTH SYSTEM SCIENCES》(IF4.936)上。此项研究是该团队继小尺度(黑河上游天老池小流域,Journal of Hydrology, 2017, 546: 526–541)和中尺度(黑河流域上游,Geoderma. 2018, 324: 56-66)研究之后,在大尺度(整个黑河流域)的土壤粒径空间插值工作上取得的突破性进展。

论文信息:

Zhang Mo, Shi Wenjiao*, Xu Ziwei. Systematic comparison of five machine-learning models in classification and interpolation of soil particle size fractions using different transformed data, Hydrol. Earth Syst. Sci., 2020, 24, 2505–2526. https://doi.org/10.5194/hess-24-2505-2020.

论文链接


附件下载: