利用可解释机器学习模型预测尾水受纳河流潜流带中的微生物活性和丰度
编号:1488
访问权限:私有
更新:2023-04-10 20:46:50
浏览:421次
口头报告
摘要
潜流带是连接地表水和地下水的重要纽带,对改善水质、维护生态安全具有重要作用。在干旱或半干旱地区,污水处理厂尾水是受纳河流基流的重要甚至唯一补给。然而,鲜有研究关注尾水受纳河流潜流带中微生物活性、丰富度及其与环境因素之间的联系。本研究以西安市两条代表性尾水主导型受纳河流为研究对象开展研究。以土地利用数据、地表和地下水水质参数为预测变量,以潜流带沉积物微生物呼吸电子传递系统活性(ETSA)、微生物群落的Chao1和Shannon指数、反硝化细菌群落的Chao1(N Chao1)和Shannon(N Shannon)指数为响应变量,基于随机森林(RF)和极端梯度增强(XGBoost)两种机器学习模型,利用SHapley Additive exPlanations机器学习解释工具,研究了环境因素如何相互作用并驱动潜流带中微生物活性和丰度的变化。
研究表明以Chao1和Shannon为响应变量的预测模型具有较好的预测性能(R2分别为 0.754~0.81和0.783~0.839)。特定水质参数可有效预测潜流带中微生物丰富度,其中溶解性有机氮(DON)是影响微生物活性和丰富度预测效果的最主要因素,且在模型中有2 mg/L的浓度阈值。DON在污水受纳水体中的生态效应正受到越来越多的关注(Eom et al., 2017; Mackay et al., 2020),本研究的模型结果进一步证实DON会显著影响河流系统中微生物群落多样性和功能。
模型在预测N Chao1和N Shannon时可获得可信的预测结果(R2分别为 0.484~0.624和0.567~0.638)。在利用RF模型预测N Shannon时,SRP是最重要的环境因素。而在XGBoost模型预测过程中,SRP、Fe(II)和水温三个特征值对模型预测结果的影响最为显著。尽管XGBoost模型的预测效果不如RF模型,但XGBoost模型可以同时考虑更多的环境因素,有利于不同环境条件下潜流带生态过程的预测。在XGBoost模型中,Fe(II)被证明有利于提高反硝化细菌群落的丰富度和多样性。通过对ESTA的预测,研究进一步证实总氮在潜流带生态健康监测中的重要性。研究为利用机器学习方法预测强人为活动影响地区的微生物活性和丰度提供了新的见解。
关键词
机器学习,潜流带,微生物丰富度,尾水主导型河流
发表评论