任务3:模型迭代优化

139 阅读1分钟

实操步骤:

  1. 在现有特征工程基础上,加入新的特征观察模型F1是否发生变化。
  2. 尝试三组能增加模型精度的特征,并记录下特征编码过程
  3. 将最优的特征从新训练模型,提交结果。
from sklearn.metrics import f1_score

# 重新定义特征和目标列
features = train_data.drop(['udmap', 'common_ts', 'uuid', 'target'], axis=1)
target = train_data['target']

# 初始化随机森林模型
rf_model = RandomForestClassifier(n_estimators=5, random_state=42)

# 使用交叉验证进行预测并计算macro F1
pred = cross_val_predict(rf_model, features, target, cv=5)
macro_f1_after_feature_engineering = f1_score(target, pred, average='macro')

print(f"经过特征工程后的模型 macro F1: {macro_f1_after_feature_engineering}")

经过特征工程后的模型 macro F1: 0.7516050084272383