[论文分享]Predicting Passivhaus certification of dwellings using machine learning: A comparative analysis of logistic regression and gradient boosting decision trees

📃 基本信息

[论文标题] 《使用机器学习预测被动式住宅认证:逻辑回归与梯度提升决策树的比较分析》
[期刊信息] Journal of Building Engineering (2023) | 作者: Yusheng Du, Zhonghua Gou

📌 一句话概括

该研究比较了逻辑回归与三种梯度提升决策树算法在预测被动式住宅认证方面的表现,发现CatBoost模型分类准确率最高,而LightGBM在预测校准方面表现最佳。

📚 深度总结

本研究针对被动式住宅(Passivhaus)认证预测问题,构建了基于机器学习的预测模型。研究以785栋位于两个主要气候区(温带无干季暖夏Cfb和寒冷无干季暖夏Dfb)的住宅为样本,探索了建筑特征与其能源性能之间的关系。

在研究方法上,作者首先从国际被动式住宅数据库提取数据,通过科潘-盖格气候分类系统进行分类,并将样本划分为被动式住宅(n=400)和非被动式住宅(n=385)两组。通过统计分析筛选出9个显著影响因素,包括气候区、外墙U值、地板U值、屋顶U值、玻璃U值、气密性和生态设计等关键参数。研究采用逻辑回归(LR)和梯度提升决策树(GBDT)两种模型,并在GBDT中比较了三种提升方法:XGBoost、LightGBM和CatBoost。

结果表明,所有GBDT模型在分类性能上均优于传统的逻辑回归模型。其中CatBoost模型在外部验证集上表现最佳(F1=0.73,Logloss=0.63,AUC=0.78,Brier=0.22),显示出较强的泛化能力;而LightGBM模型(F1=0.79,Logloss=0.58,AUC=0.75,Brier=0.20)则在预测校准方面表现最优。特征重要性分析显示,外墙、地板和屋顶的热性能是影响建筑能否达到被动式标准的关键因素。

研究还发现被动式住宅技术在全球分布具有明显的气候相关性,主要集中在欧洲和北美的高纬度地区。针对外墙、地板和屋顶等关键组件,研究还讨论了创新实践和技术应用,包括真空绝热板、挤塑聚苯乙烯泡沫等高效隔热材料的应用。

该研究为建筑师、设计师和业主提供了科学可靠的建筑设计和能源管理解决方案,有助于提高建筑能效和舒适度,也为政府部门制定能源政策提供了实证基础。

本速览仅作研究参考,不替代原文阅读。如需引用,请参考原论文。

🔍 要点追溯

  • 研究方法: 数据挖掘+机器学习建模+特征重要性分析
  • 适用范围: 温带和寒冷气候区住宅建筑
  • 使用工具: 逻辑回归、XGBoost、LightGBM、CatBoost
  • 数据来源: 国际被动式住宅数据库(n=785栋住宅)
  • 参考标准: 被动式住宅研究所(PHI)认证标准

🔗 原文获取

点击查看