混淆矩阵的原理以及使用

489 阅读1分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

前言

混淆矩阵用来评估分类的准确性。


一、原理详解

混淆矩阵:混淆矩阵是将真实值与预测值匹配以及不匹配的项一起放入到矩阵中,它可以清楚的反映出真实值和预测值相同的地方,也可以反映出与预测值不相同的地方,举一个多分类的例子。 在这里插入图片描述 如图所示:图示为一个情感多分类例子的混淆矩阵,从图中我们可以看出,真实样例为生气,并且被预测为生气的例子一共有98例,同一列的其他行表示真实样例为生气,但是被预测为其他情感的例子数量。混淆矩阵的正对角线表示的是真实值与预测值相互匹配的样例数。

二、混淆矩阵的相关API介绍以及样例

# 导入相关API
from sklearn.metrics import confusion_matrix
y_true = [2, 0, 2, 2, 0, 1]
y_pred = [0, 0, 2, 2, 0, 2]
# Parameters: 参数介绍
# y_true: 真实值
# y_pred:预测值
# labels: 标签列表,默认为空,按照标签列表来重新排列混淆矩阵。
confusion_matrix(y_true, y_pred, labels=None)
array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])