学习来源:DataWhale AI夏令营
从零入门 AI for Science(AI+经济) 是 Datawhale 2024 年 AI 夏令营第三期的学习活动
基于阿里云天池平台 “第二届世界科学智能大赛社会科学赛道:市场博弈和价格预测” 开展的实践学习
AI夏令营学习体验:教学教程写的非常细致!代码和所用的模型都配有相关的解释,帮助小白快速上手,完成比赛练习。 👍
模型优化、思路总结、知识延拓……
关于赛题
比赛是关于预测特定时间段内每 15 分钟的市场出清价格,既可以依靠时间序列模型,也可尝试使用 ABM 模型。最终评价指标为 MSE 和 RMSE 的均值,值越小越好。还对 ABM 模型进行了介绍,指出其是基于个体建模来模拟系统复杂行为的工具,有众多应用案例,与 DW 数学建模教程中的微分方程和动力系统相似但又有区别,在面对复杂交互和增多参数时,ABM 提供了从简单个体交互规则涌现系统复杂性的方案,并举例说明了相关规则。
参赛要点
- 比赛内容:预测 2023 年 7 月 1 日到 2024 年 4 月 18 日每 15 分钟的市场出清价格。
- 模型选择:可使用时间序列模型或 ABM 模型,比赛方期待选手使用 ABM 模型。
- 评价指标:最终评价指标为 MSE 和 RMSE 的均值,越小越好。
- ABM 模型介绍:是模拟系统复杂行为的工具,通过模拟个体行为和相互作用研究系统动态变化,有诸多应用案例。
- ABM 与其他建模的关系:与 DW 数学建模教程中的微分方程和动力系统一脉相承,但 ABM 更关注简单交互规则。
- ABM 实现复杂模拟的方案:通过简单的个体交互规则涌现系统的复杂性,举例说明了相关规则。
学习要点
- 时间序列预测:
- 时间序列预测是一种数据分析方法,用于根据历史数据预测未来的趋势和模式。
- 在该比赛中,可以尝试从时间序列的角度挖掘更多信息来提高分数。
- ABM(主体建模 Agent - based model):
- ABM 是一种基于个体建模来模拟系统复杂行为的方法。
- 通过模拟个体的行为和相互作用,可以研究系统的动态变化。
- 在该比赛中,赛方期待选手使用 ABM 模型,教程会介绍其构建思路并给出代码实现示例。
- 理解:
- 对于时间序列预测,需要挖掘数据中的时序信息,以找到提高分数的方法。
- ABM 与 DW 数学建模教程中的微分方程和动力系统有一定联系,但更关注简单个体交互规则涌现出的系统复杂性。
- 在数据挖掘类比赛中,理解数据并构造强特征是关键,而 ABM 模型的构建和应用需要深入学习其相关方法和思路。
Baseline思路 1
![]()
图由DataWhale开源教程贡献者绘制
上分技巧
- 时间序列挖掘(较容易):
- 具体操作:
- 提供了一个简单的时间序列Baseline作为参考,可下载相关文件并按类似Task1中的流程在Modelscope平台中跑通。
- 进行特征工程,包括构造时间戳特征(年、月、日等)、历史信息特征(过去n期同日期的均值、标准差等)、滞后特征(数据平移n期)、滑窗特征(历史7天、14天等的均值、标准差等)、周期特征(将年月日等时间特征转为正余弦函数)、异常值特征(用3标准差原则发现总负荷的异常值作为特征)、节假日特征与外部数据(节假日与天气数据在本案例中有很大的影响)。
- 具体代码操作包括读取数据、构造特征(如根据时间信息创建布尔型列、对时间特征进行独热编码等)。
- 理论原理:特征工程的目标是通过选择和构建合适的特征,使模型能够更好地理解数据和预测目标变量。时间序列特征的构造基于对数据中时间模式和相关性的分析。
- 能上分的原因:通过挖掘和利用时间序列中的多种特征信息,可以更准确地捕捉数据的模式和趋势,从而提高模型的预测性能,进而实现上分。
- ABM报价策略优化(难度中偏上):
- 具体操作:(待练习)
- 理论原理:通过模拟个体的行为和相互作用来研究系统的动态变化,从而优化报价策略。
- 能上分的原因:合理优化ABM报价策略可以更好地适应市场博弈和价格预测的情境,提高报价的准确性和有效性,从而有助于提高分数。
- 强化学习(难度难):
- 具体操作:(待练习)
- 理论原理:强化学习通过与环境进行交互并根据奖励信号来学习最优策略。
- 能上分的原因:在电力现货市场价格预测中,强化学习可以根据市场的动态变化实时调整策略,以更好地适应市场情况,从而有机会提高预测的准确性和得分。 需要注意的是,文本中对ABM报价策略优化和强化学习的具体操作细节未作详细说明。