Fan Chen
返回项目页

项目案例

机器学习驱动的上海房价预测

基于 XGBoost 与 SHAP 的上海月度房价趋势预测。

我的角色

机器学习建模与解释分析

项目阶段

数据清洗、建模、解释与评估

关键结果

最终模型 RMSE 320.06,MAE 176.82,明显优于线性回归,并识别上月价格增长、M2、股市指标、消费者信心等关键变量。

01

背景

上海房地产市场波动明显,影响因素横跨宏观经济、金融环境、政策变化和市场情绪。传统线性模型很难捕捉这些变量之间的复杂关系。

02

问题

这个项目关注两个问题:如何用机器学习预测短期房价趋势,以及如何解释影响价格变化的关键变量,而不是只得到一个黑箱预测结果。

03

方案或方法

我完成数据清洗、特征工程、XGBoost 建模、线性回归对比和 SHAP 解释分析,将 2000-2024 年上海住房价格、宏观经济、金融、政策与情绪变量整合进同一套预测框架。

04

分析流程

01

数据整理

整合 2000–2024 年上海房价、宏观经济、金融、政策与情绪变量,并构建滞后特征。

02

模型训练

使用 XGBoost 建立预测模型,并以线性回归作为基准模型进行对比。

03

模型评估

通过 RMSE、MAE 验证预测效果,判断模型是否具备稳定解释价值。

04

结果解释

使用 SHAP 分析关键变量贡献,将模型输出转化为可理解的市场判断。

05

结果

最终 XGBoost 模型 RMSE 为 320.06,MAE 为 176.82,明显优于线性回归。SHAP 结果显示,上月价格增长、M2、股市指标、消费者信心等变量对预测具有重要影响。

06

关键输出

  • 上海房价月度趋势预测模型
  • XGBoost 与线性回归模型对比
  • RMSE / MAE 模型评估结果
  • SHAP 变量重要性解释
  • 房地产市场影响因素分析
  • 可视化分析报告
07

复盘

这个项目连接了房地产、宏观经济、机器学习和可解释 AI,是我从建筑环境管理转向数据驱动决策的核心项目。

PDF

原始交付物

本页面为项目摘要版,完整研究过程与模型细节可查看原始报告。

查看完整报告