字数
326 字
阅读时间
2 分钟
为对比删减特征和未删减特征的LightGBM谷物单产模型性能,本文研究采用五折交叉验证。具体流程包括:将数据集随机打乱并均匀划分为5个互不相交的子集;每次选取其中4个子集作为训练集,剩余1个作为验证集,重复进行5次训练与验证,确保每个子集均充当过一次验证集。最终以5次验证所得评价指标的均值作为模型性能的点估计。 删减特征版五折 R2均在 0.901–0.943 之间,平均 0.9279,标准差 0.0164。 全部特征版五折 R2 在 0.881–0.939 之间,平均 0.9173,标准差 0.0208。 结论:删减特征不仅平均拟合优度更高(+0.0106),而且各折之间波动更小,说明模型泛化稳定性有所提升。 统计显著性:差异达到 0.05 显著水平 配对 t 检验的 p 值为 0.0344,小于常用显著性水平 0.05,说明两种特征集对应的交叉验证 R2差异具有统计学意义,删减特征模型的表现显著优于全特征模型。