Fan Chen
返回项目页

项目案例

机器学习驱动的上海房价预测

基于 XGBoost 与 SHAP 的上海月度房价趋势预测。

我的角色

机器学习建模与解释分析

项目阶段

数据清洗、建模、解释与评估

关键结果

最终模型 RMSE 320.06,MAE 176.82,明显优于线性回归,并识别上月价格增长、M2、股市指标、消费者信心等关键变量。

策略快照

业务问题

能否在房价趋势明显前读出市场变化?

这个项目把宽泛的房地产研究转化为月度预测问题,让模型不只是解释过去,而是支持更早的市场判断。

报告证据

误差改善 98%+,并能解释关键驱动

XGBoost 将 RMSE 从 18,222.69 降到 320.06,SHAP 进一步指出价格惯性、M2、股市指标和消费者信心等核心变量。

策略信号

更适合作为市场预警框架

模型结果可以转化成动量、流动性、情绪和政策方向的观察面板,帮助分析师讨论市场时点和风险。

01

背景

上海房地产市场波动明显,影响因素横跨宏观经济、金融环境、政策变化和市场情绪。传统线性模型很难捕捉这些变量之间的复杂关系。

02

问题

这个项目关注两个问题:如何用机器学习预测短期房价趋势,以及如何解释影响价格变化的关键变量,而不是只得到一个黑箱预测结果。

03

方案或方法

我完成数据清洗、特征工程、XGBoost 建模、线性回归对比和 SHAP 解释分析,将 2000-2024 年上海住房价格、宏观经济、金融、政策与情绪变量整合进同一套预测框架。

04

分析流程

01

数据整理

整合 2000–2024 年上海房价、宏观经济、金融、政策与情绪变量,并构建滞后特征。

02

模型训练

使用 XGBoost 建立预测模型,并以线性回归作为基准模型进行对比。

03

模型评估

通过 RMSE、MAE 验证预测效果,判断模型是否具备稳定解释价值。

04

结果解释

使用 SHAP 分析关键变量贡献,将模型输出转化为可理解的市场判断。

05

关键证据

最终模型

RMSE 320.06 / MAE 176.82

最终 XGBoost 模型能够较稳定地追踪 2021-2024 年上海月度房价走势。

误差改善

98%+

相比初始基准模型 RMSE 18,222.69,经过目标重构和特征工程后预测误差显著下降。

核心信号

价格惯性

SHAP 显示上月价格增长是最重要变量,说明短期房价变化具有明显动量特征。

宏观驱动

M2 流动性

货币供应量是重要宏观金融变量,可用于解释市场预期和资金环境变化。

模型效果快照

目标重构和特征工程后,最终模型相比基准模型显著降低误差。

基准 RMSE18,222.69
最终 XGBoost RMSE320.06
最终 XGBoost MAE176.82

市场驱动地图

这个模型更适合作为市场解释框架,而不是只输出一个预测数字。

动量

上月价格增长

SHAP 分析中最强的短期预测变量。

流动性

M2 货币供应

连接资金环境与市场预期的宏观金融信号。

情绪

消费信心 / 股市指标

反映投资者情绪和资金再配置压力。

06

判断逻辑

把模型作为市场预警工具,而不是自动投资指令

模型的价值在于持续观察价格惯性、流动性、情绪和政策信号是否同向变化,帮助形成更早的市场判断。

把 SHAP 结果翻译成业务语言

面向业务或投资讨论时,重点不是展示算法复杂度,而是解释哪些因素正在推动市场变化。

07

结果

最终 XGBoost 模型 RMSE 为 320.06,MAE 为 176.82,明显优于线性回归。SHAP 结果显示,上月价格增长、M2、股市指标、消费者信心等变量对预测具有重要影响。

08

关键输出

  • 上海房价月度趋势预测模型
  • XGBoost 与线性回归模型对比
  • RMSE / MAE 模型评估结果
  • SHAP 变量重要性解释
  • 房地产市场影响因素分析
  • 可视化分析报告
09

复盘

这个项目连接了房地产、宏观经济、机器学习和可解释 AI,是我从建筑环境管理转向数据驱动决策的核心项目。

PDF

原始交付物

本页面为项目摘要版,完整研究过程与模型细节可查看原始报告。

查看完整报告