目标检测评估指标mAP

2023-02-07 约 915 字预计阅读 2 分钟

目标检测任务

目标检测任务是计算机视觉领域的一个分支，其关注图片中物体的类别和位置信息，给定一张图片，需要给出图片中感兴趣物体的类别、位置和置信度，位置通过一个矩形的检测框来表示。

ground truth box：人工标注的真实框，相当于标准答案。

BB(bounding box)：预测框

pipeline：流程（流水线）

confidence scores：置信度，用于评估一个预测框中含有某个对象的概率。

IoU(intersection over union)直译为交并比（交集除以并集）

从图形可以看出，IoU用来衡量两个框（预测框和真实框）之间的相似性。IoU越大，两个框越相似，说明模型预测的越好。

首先考虑以下的混淆矩阵：

与一般的分类问题相比，目标检测任务中True Positives、False Positives、True Negatives和 False Negatives的鉴别会更复杂：

对于模型给出的预测框，我们使用置信度阈值来评估一个框是Positive还是Negative。
对于Positive预测框，计算与所有ground truth的IoU，取最大值，通过IoU阈值来评估预测为True Positive还是False Positive。
ground truth的数量减去True Positive即为False Negative的数量。

精度 $$ \text { Precision }=\frac{T P}{T P+F P} $$ 召回率 $$ \text { Recall }=\frac{T P}{T P+F N} $$ recall和precision是模型性能两个不同维度的度量：

recall度量的是「查全率」，所有的正样本是不是都被检测出来了。比如在肿瘤预测场景中，要求模型有更高的recall，不能放过每一个肿瘤。
precision度量的是「查准率」，在所有检测出的正样本中是不是实际都为正样本。比如在垃圾邮件判断等场景中，要求有更高的precision，确保放到回收站的都是垃圾邮件。

这两个参数是矛盾的，二者不可能同时到达最大值，将recall-precision分别做横纵轴绘制图像，图像下面积即为AP（average precision）。

mAP（mean Average Precision）为全类平均正确率，对所有类别的AP取平均值即为mAP。衡量模型在一个数据集上的所有类别的识别性能。