项目案例
机器学习驱动的上海房价预测
基于 XGBoost 与 SHAP 的上海月度房价趋势预测。
我的角色
机器学习建模与解释分析
项目阶段
数据清洗、建模、解释与评估
关键结果
最终模型 RMSE 320.06,MAE 176.82,明显优于线性回归,并识别上月价格增长、M2、股市指标、消费者信心等关键变量。
策略快照
业务问题
能否在房价趋势明显前读出市场变化?
这个项目把宽泛的房地产研究转化为月度预测问题,让模型不只是解释过去,而是支持更早的市场判断。
报告证据
误差改善 98%+,并能解释关键驱动
XGBoost 将 RMSE 从 18,222.69 降到 320.06,SHAP 进一步指出价格惯性、M2、股市指标和消费者信心等核心变量。
策略信号
更适合作为市场预警框架
模型结果可以转化成动量、流动性、情绪和政策方向的观察面板,帮助分析师讨论市场时点和风险。
背景
上海房地产市场波动明显,影响因素横跨宏观经济、金融环境、政策变化和市场情绪。传统线性模型很难捕捉这些变量之间的复杂关系。
问题
这个项目关注两个问题:如何用机器学习预测短期房价趋势,以及如何解释影响价格变化的关键变量,而不是只得到一个黑箱预测结果。
方案或方法
我完成数据清洗、特征工程、XGBoost 建模、线性回归对比和 SHAP 解释分析,将 2000-2024 年上海住房价格、宏观经济、金融、政策与情绪变量整合进同一套预测框架。
分析流程
数据整理
整合 2000–2024 年上海房价、宏观经济、金融、政策与情绪变量,并构建滞后特征。
模型训练
使用 XGBoost 建立预测模型,并以线性回归作为基准模型进行对比。
模型评估
通过 RMSE、MAE 验证预测效果,判断模型是否具备稳定解释价值。
结果解释
使用 SHAP 分析关键变量贡献,将模型输出转化为可理解的市场判断。
关键证据
最终模型
RMSE 320.06 / MAE 176.82
最终 XGBoost 模型能够较稳定地追踪 2021-2024 年上海月度房价走势。
误差改善
98%+
相比初始基准模型 RMSE 18,222.69,经过目标重构和特征工程后预测误差显著下降。
核心信号
价格惯性
SHAP 显示上月价格增长是最重要变量,说明短期房价变化具有明显动量特征。
宏观驱动
M2 流动性
货币供应量是重要宏观金融变量,可用于解释市场预期和资金环境变化。
模型效果快照
目标重构和特征工程后,最终模型相比基准模型显著降低误差。
市场驱动地图
这个模型更适合作为市场解释框架,而不是只输出一个预测数字。
动量
上月价格增长
SHAP 分析中最强的短期预测变量。
流动性
M2 货币供应
连接资金环境与市场预期的宏观金融信号。
情绪
消费信心 / 股市指标
反映投资者情绪和资金再配置压力。
判断逻辑
把模型作为市场预警工具,而不是自动投资指令
模型的价值在于持续观察价格惯性、流动性、情绪和政策信号是否同向变化,帮助形成更早的市场判断。
把 SHAP 结果翻译成业务语言
面向业务或投资讨论时,重点不是展示算法复杂度,而是解释哪些因素正在推动市场变化。
结果
最终 XGBoost 模型 RMSE 为 320.06,MAE 为 176.82,明显优于线性回归。SHAP 结果显示,上月价格增长、M2、股市指标、消费者信心等变量对预测具有重要影响。
关键输出
- 上海房价月度趋势预测模型
- XGBoost 与线性回归模型对比
- RMSE / MAE 模型评估结果
- SHAP 变量重要性解释
- 房地产市场影响因素分析
- 可视化分析报告
复盘
这个项目连接了房地产、宏观经济、机器学习和可解释 AI,是我从建筑环境管理转向数据驱动决策的核心项目。