【Datawhale AI夏令营24-3-task2 笔记】

104 阅读1分钟

一. 赛题背景及task1

【Datawhale AI夏令营24-3-task1 笔记】 - 掘金 (juejin.cn)

二. task2总结

介绍探索性数据分析(Exploratory Data Analysis, EDA),并通过baseline展示如何挖掘和分析数据中蕴藏的影响因素。

三. 一些值得记忆的知识点

sns.displot(...) 函数用于绘制数据的分布图

pd.pivot_table(...)函数用于绘制透视表

通过绘图,直观展示数据特征和某些要素的关系,再借助相关背景知识辅助分析,挖掘数据集以外的影响因素。在此预测火电出清价格的赛题背景中,挖掘数据集以外的影响因素有:节假日、一天中时间(高峰期低谷期)、风电光伏发电等等。

四. 感受

第一次遇见seaborn库,它还能和matplotlib混用。该task教了很多画图技能,不错的,也展示了EDA思路。就是对于如何把EDA分析出来的特征融入baseline1代码没有什么头绪,如果能给点提示就好了,比如用哪个包,用什么思路等等。当然如果教程没有给的话,那就自己探索,这也是一种锻炼吧。