下面是小编为大家整理的理解混淆矩阵【精选推荐】,供大家参考。
理解混淆矩阵 混淆矩阵是描述分类器/分类模型的性能的表。它包含有关分类器完成的 实际和预测分类的信息,此信息用于评估分类器的性能。
请注意,混淆矩阵仅用于分类任务,因此不能用于回归模型或其他非分类模型。
在我们继续之前,让我们看看一些术语。
分类器:分类器基本上是一种算法,它使用从训练数据中获得的“知识”来将输入数据映射到特定类别或类别。分类器是二元分类器或多类/多分类/多标签/多输出分类器。
训练和测试数据:在构建分类模型/分类器时,数据集被分成 训练数据和具有相关标签的 测试数据。标签是预期的输出,它是数据所属的类别或类别。
实际分类:这是数据的预期输出(标签)。
预测分类:这是分类器为特定输入数据提供的输出。
一个例子:假设我们已经建立了一个分类器来将汽车的输入图像分类为轿车或者不是轿车,我们在数据集中有一个标记为非轿车的图像,但分类模型归类为轿车。
在这种情况下,实际分类 是非轿车,而预测分类是 轿车。
混淆矩阵的类型 有两种类型的混淆矩阵:
2 级混淆矩阵
多级混淆矩阵 2 级混淆矩阵 顾名思义,2 类是一个描述二元分类模型性能的混淆矩阵。我之前描述的 轿车分类器的 2 级矩阵可以这样显示:
在此可视化中,我们有两个已概述的部分。我们有 预测的分类部分,其中包含每个类的两个子部分和 实际的分类部分,每个部分有两个子部分。
如果这是您第一次看到混淆矩阵,我知道您必须想知道表中的所有变量代表什么。实际上它很简单,我会尽可能简单地解释,但在我这样做之前,知道这些变量代表了许多预测是很重要的。
量 变量 a
变量 a 属于 Actual 和 Predicted 分类部分中的 Non-sedan子部分。这意味着 一个预测所做的正确分类的非轿车[作为非轿车]的图像。
量 变量 b 变量 b 属于 实际分类部分中的 非轿车子部分和 预测分类部分中的 轿车子部分。这意味着进行了 b 预测,将非轿车的图像错误地分类为轿车。
量 变量 c 变量 ç落在下的 轿车在次节 实际分类段和下的 非轿车在小节预测分类部分。这意味着进行了 c 预测,将轿车的图像错误地分类为非轿车。
量 变量 d 变量 d 属于 实际和 预测分类部分中的 轿车子部分。这意味着 d 预测所做的正确分类轿车的图像[作为轿车。
容易腻的柠檬挤压。(我希望?