在做目標檢測方面的神經網絡開發時,不可避免需要用到訓練數據。目前在目標檢測中比較有名的數據集是:
PASCAL VOC,MS COCO,ImageNet.
我收集匯總了常見的一些數據集的地址方便以后使用。
1. PASCALVOC
http://host.robots.ox.ac.uk/pascal/VOC/
VOC數據集是目標檢測經常用的一個數據集,從05年到12年都會舉辦比賽(比賽有task:Classification 、Detection(將圖片中所有的目標用bounding box框出來)、Segmentation(將圖片中所有的目標分割出來)、Person Layout).
有VOC2007和VOC2012兩個數據集。
包含約10,000張帶有邊界框的圖片用于訓練和驗證。含有20個類別。具體包括
Person: person
Animal: bird, cat, cow, dog, horse,sheep
Vehicle: aeroplane, bicycle, boat,bus, car, motorbike, train
Indoor: bottle, chair, dining table,potted plant, sofa, tv/monitor
注:由于類別僅20個,因此被看成目標檢測方向的一個基準數據集
關于數據集:
- 所有的標注圖片都有Detection需要的label, 但只有部分數據有SegmentationLabel。
- VOC2007中包含9963張標注過的圖片, 由train/val/test三部分組成, 共標注出24,640個物體。
- VOC2007的test數據label已經公布, 之后的沒有公布(只有圖片,沒有label)
- 對于檢測任務,VOC2012的trainval/test包含08-11年的所有對應圖片。trainval有11540張圖片共27450個物體。
數據集下載完后會有5個文件夾。Annotations、ImageSets、JPEGImages、SegmentationClass、SegmentationObject。
2.MSCOCO數據集:
是微軟公司建立的數據集。對于目標檢測任務,COCO包含80個類別,每年大賽的訓練和和驗證集包含120,000張圖片,超過40,000張測試圖片。下面是這個數據集中的80個類別:
Person#1:person
Vehicle#8:bicycle,car,motorcycle,airplane,bus,train,truck,boat
Outdoor#5:traffic light, firhydrant, stop sign, parking meter, bench
Animal#10:bird,cat, dog,horse, sheep, cow, elephant, bear, zebra, giraffe
Accessory#5:backpack, umbrella,handbag, tie, suitcase
Sport#10:frisbee, skis,snowboard, sports ball, kite, baseball bat , baseball glove, skateboard, surfboard, tennisracket
Kitchen#7:bottle, wine glass,cup, fork, knife, spoon, bowl
Food#10:banana, apple,sandwich, orange, broccoli, carrot, hot dog, pizza, donut, cake
Furniture#6: chair, couch, potted plant,bed, dining table, toilet
Electronic#6:tv, laptop, mouse,remote, keyboard, cell phone
Appliance#5:microwave, oven,toaster, sink, refrigerator
Indoor#7:book, clock, vase,scissors, teddy bear, hair drier, toothbrus
MS COCO數據集介紹以及下載鏈接:
3.ImageNet數據集:
是一個計算機視覺系統識別項目,是目前世界上圖像識別最大的數據庫,是美國斯坦福的計算機科學家,模擬人類的識別系統建立的。ImageNet數據集是按照WordNet架構組織的大規模帶標簽圖像數據集。大約1500萬張圖片,2.2萬類,每張都經過嚴格的人工篩選與標記。ImageNet類似于圖片所有引擎。
其中,包括邊界框的目標檢測數據集,訓練數據集包括500,000張圖片,屬于200類物體。由于數據集太大,訓練所需計算量很大;類別數較多;造成了很少使用和目標檢測的難度也很大。
ImageNet數據集介紹以及下載鏈接:
4.?其它更多分類數據集:
https://blog.csdn.net/u010429424/article/details/72171476#gesture
這里包括了以下種類的數據集:行動數據庫,屬性識別,自主駕駛
生物/醫藥,相機校準,臉和眼/虹膜數據庫,指紋,一般圖像,一般RGBD和深度數據集,一般視頻,手,掌握,手動和手勢數據庫,圖像,視頻和形狀數據庫檢索,對象數據庫,人(靜),人體姿勢,人員檢測和跟蹤數據庫(另見監控),遙感,場景或地點分割或分類,分割,同時本地化和映射,監視和跟蹤(另見人物),紋理,城市數據集,其他收藏頁,雜項主題
5. 關于數據集的博客:
https://blog.csdn.net/liuxiao214/article/details/80552026