分类问题的指标

120 阅读1分钟

Base

TP (True Positive) :实际为正,预测为正

FP (False Positive):实际为负,预测为正

TN (True Negative): 实际为负,预测为负

FN (False Negative):实际为正,预测为负

精确率和召回率

precision = TP/(TP+FP) recall = TP/(TP+FN) f1_score = 2pr/(p+r) accuracy就是预测正确的占比

多分类问题f1score

Micro-F1

所有类别的TP,FP,FN加起来,然后计算precision和recall,以及f1

Macro-F1

每个类别单独算出自己的precision、recall、f1,求平均

Weighted-f1

根据每个类别占比加权求和所有类别的f1score

sklearn.metrics.f1_score

sklearn.metrics.f1_score(tag, pred, average='weighted')
average可选'weighted'、'micro'、'macro'等