目标检测之公开图像数据集

百度首页

建立一个具有较小偏差的大数据集，对于开发先进计算机视觉算法是很重要的。在目标检测中，许多知名的数据集在最近10年之内被发布，包括PASCALVOCChallenges（例如VOC2007,VOC2012）,ImageNetLargeScaleVisualRecognitionChallenge（例如ILSVRC2014）,MS-COCODetectionChallenge等。

下表列出了这些数据集的一些统计特征：

计算机视觉算法：基于OpenCV的计算机应用开发

京东

¥47

购买

已下架

下图显示了一些样本及其标注：

其中(a)PASCAL-VOC07,(b)ILSVRC,(c)MS-COCO,and(d)OpenImages。

1 Pascal VOC

在早期的计算机视觉社区，PASCALViSualObjectClasses（VOC）挑战赛（从2005年到2012）是最重要的竞赛之一。在PASCALVOC中是多任务的，包括图像分类，目标检测，语义分割和行为检测。

在目标检测中有两个Pascal-VOC版本：VOC07和VOC12，其中前者有5k张图像和27k个被标注目标，后者则有11k张图像和27k个被标注的目标。20类标注目标都是生活中常见：(Person:person;Animal:bird,cat,cow,dog,horse,sheep;Vehicle:aeroplane,bicycle,boat,bus,car,motor-bike,train;Indoor:bottle,chair,diningtable,pottedplant,sofa,tv/monitor。

最近几年，随着一些大型数据集，如ILSVRC和MS-COCO被发布，VOC也逐渐失去了往日的光彩，目前主要是作为新检测器的测试地。

2 ILSVRC

ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)已经将一般的目标检测向前推进了一大步。ILSVRC从2010到2017年每年被组织比赛，其中就包含了用ImageNet图像进行检测。ILSVRC中包含了200类视觉目标，图像和目标实例的数量比VOC大两个数量级。例如，ILSVRC-14就包含了517K张图像和534k被标注的目标

3 MS-COCO

MS-COCO是目前最具有挑战性的目标检测，从2015年开始，每年都会举办基于MS-COCO数据集的竞赛，其包含的目标种类要少于ILSVRC，但其有更多的目标实例。例如，MS-COCO-17中包含了164k张图像和897K个被标注来自80个类别的目标。相比于VOC和ILSVRC，MS-COCO最大的进步，除了boundingbox的标注，还有单个实例分割的标注，帮助更准确的定位。另外，MS-COCO包含了更多小目标（其面积小于图像的1%）和更加密集的定位目标比VOC和ILSVRC。MS-COCO的这些特征让其目标分布更接近于真实的世界。MS-COCO已经在目标检测社区变为了实际的标杆。

视觉计算基础：计算机视觉、图形学和图像处理的核心概念

京东好评率100%无理由退换京东配送官方店

¥82.6

购买

4 Open Images

2018年，OpenImagesDetection(OID)竞赛紧随MS-COCO被引进。在OpenImages中有两个重要的任务：1）标准的目标检测；2）视觉关系检测，即检测具有特定关系的成对目标。对于目标检测任务，此数据集包含了1910k张图像，其中在600多个目标种类上有15440k个标注的boundingbox。

5 其他检测任务的数据集

除了一般的目标检测，在过去的20年也见证了在特定领域内检测应用的繁荣，例如行人检测，人脸识别，文本检测，交通信号检测和遥感目标检测。

（1）行人检测数据集