电价预测,10种深度学习模型+SHAP分析,TimeMixer效果碾压!

张开发
2026/6/7 14:13:09 15 分钟阅读
电价预测,10种深度学习模型+SHAP分析,TimeMixer效果碾压!
引言电力市场价格受发电结构、负荷波动、天气条件等多重因素影响呈现出强烈的非线性和周期性特征。准确预测电力价格对电力交易、调度优化和风险管理都具有重要意义。本期以西班牙电力市场的真实数据为研究对象横向对比了 10 种机器学习与深度学习模型的预测效果并加入了SHAP可解释性分析。10种模型包括TimeMixerPatchTSTiTransformerModernTCNLSTMGRUCNN-LSTMBiLSTMTransformerLightGBM一、数据概况项目使用公开数据集该数据集包含西班牙 4 年的电力消耗、发电、价格和天气数据。用电和发电数据从 ENTSOE 获取ENTSOE 是输电服务运营商TSO数据的公共门户。结算价格由西班牙 TSO 红色电气公司获得。energy_dataset.csv包含 2015—2018 年西班牙电力市场的小时级数据约 35000 条涵盖各类发电量核电、燃气、水电、风电等、负荷、日前价格预测及实际成交价格。weather_features.csv对应时段的气象数据包括温度、气压、湿度、风速、降雨、云量等。两份数据通过时间字段合并最终得到一张融合了电力系统运行信息与气象环境信息的宽表。二、数据分析在建模之前小淘对数据进行了全面的探索性分析输出了 20 张分析图主要包括数据质量检查绘制缺失值热力图识别缺失模式采用线性插值前后填充的方式处理缺失值。价格分布与趋势电力价格整体呈右偏分布均值在 50 欧元/MWh 附近存在少量极端高价和负价。从时间序列总览图可以观察到明显的年度趋势变化。周期性规律日内规律价格在早高峰8-10 时和晚高峰18-21 时明显走高凌晨 3-5 时最低。周规律工作日价格显著高于周末周一和周四通常是一周中价格最高的时段。季节规律冬季供暖需求和夏季制冷需求价格偏高春秋季相对平稳。发电结构分析核电提供稳定的基荷燃气和燃煤发电随负荷波动调节可再生能源风电、光伏的出力增加通常会压低电价。相关性分析与电价相关性最强的变量包括日前价格预测、实际负荷、燃煤发电量、燃气发电量等气象变量中温度和风速也有一定影响。时序分解对价格序列进行 STL 分解可以清晰地分离出趋势项、季节项和残差项。三、特征工程基于上面数据分析的发现小淘针对此数据构造了37 维特征大致分为四大类类别特征示例数量发电/负荷各类型发电量、实际总负荷、日前预测值15气象温度、气压、湿度、风速、降雨、云量、天气类型11时间小时、星期几、日期、是否周末、周数5滞后/滚动价格滞后t-12, t-72, t-168、滚动均值、滚动极值、负荷预测偏差6其中滞后特征捕捉价格的自相关性12 小时的日内模式、168 小时即一周的周模式滚动特征如 6 小时滚动均价刻画近期价格趋势。数据划分策略2018 年 12 月之前的数据作为训练集2018 年 12 月744 小时作为测试集模拟真实场景中对未来一个月的滚动预测。四、模型设计我们实现了1 个传统机器学习模型 9 个深度学习模型覆盖了时间序列预测的主流方法传统机器学习LightGBM深度学习模型统一采用滑动窗口方式将过去 24 小时的数据构造为输入序列预测下一小时的电价。LSTM经典长短期记忆网络2 层堆叠通过门控机制学习长期依赖。GRU门控循环单元LSTM 的轻量化变体参数更少但效果相当。BiLSTM双向 LSTM同时利用过去和未来窗口内的上下文信息。CNN-LSTM先用两层 1D 卷积提取局部模式再用 LSTM 捕捉时序依赖。Transformer标准 Transformer 编码器 位置编码通过自注意力机制捕捉序列中任意位置之间的关系。PatchTST将时间序列切分为 patch类似 ViT 对图像的处理减少序列长度提升计算效率。iTransformer反转 Transformer 的维度——对特征维度而非时间维度做注意力让模型学习变量间的交互关系。ModernTCN现代化时序卷积网络使用大核深度可分离卷积 ConvFFN 结构。TimeMixer基于时序分解的 MLP 混合器。先将序列分解为趋势项和季节项通过移动平均然后分别用独立的 MLP 在时间维度上进行混合最后合并预测。结构简洁但非常有效。训练策略所有深度学习模型采用统一的训练框架优化器Adamlr1e-3学习率调度ReduceLROnPlateau早停机制验证集 loss 连续 10 轮不下降则停止梯度裁剪max_norm1.0归一化MinMaxScaler仅在训练集上 fit五、实验结果5.1 指标对比排名模型R²RMSEMAEMAPE1TimeMixer0.93061.911.432.17%2iTransformer0.91672.101.582.38%3GRU0.91422.131.642.49%4LightGBM0.90232.271.752.67%5Transformer0.89482.361.852.80%6LSTM0.88772.431.862.82%7BiLSTM0.87002.622.053.09%8ModernTCN0.83952.912.223.35%9CNN-LSTM0.82743.022.353.54%10PatchTST0.81433.132.433.65%5.2 结果分析TimeMixer 以 R²0.93、MAPE2.17% 拿下第一其分解-分别混合-重组的设计思路非常适合电力价格这种具有明显趋势和周期成分的时序数据。iTransformer 和 GRU 紧随其后分别从变量交互和时序记忆两个角度取得了不错的效果。值得注意的是传统的LightGBM 排在第四名凭借精心的特征工程依然具有很强的竞争力。标准 Transformer、LSTM 等模型表现中规中矩而 CNN-LSTM 和 PatchTST 在本数据集上表现相对靠后。所有模型的对比图每个模型都有结果图生成这里放5个模型的结果图展示六、SHAP 可解释性分析模型预测得准固然重要但理解模型为什么这样预测同样关键。我们对表现最好的 TimeMixer 进行了 SHAPSHapley Additive exPlanations分析揭示每个特征对预测结果的贡献。关键发现Top 5 最重要特征roll_price_66 小时滚动均价—— 重要性远超其他特征说明近期价格趋势是预测未来电价最关键的信号。**price(t-12)**12 小时前价格—— 捕捉日内价格的半天周期模式。hour小时—— 电价的日内模式非常显著不同时段的定价逻辑差异很大。price day ahead日前价格预测—— 市场的日前预测本身就包含了大量信息。is_weekend是否周末—— 工作日和周末的电力需求模式截然不同。从 SHAP Summary 图中可以看到当roll_price_6取较高值红色时SHAP 值为正即推高价格预测反之取较低值蓝色时SHAP 值为负拉低预测。七、项目目录代码整理的简单明了上手非常简单代码获取https://mbd.pub/o/bread/YZWclphxag或者点击下方阅读原文获取此代码承诺以上所有实验结果均真实有效

更多文章