1.MNIST
?
MNIST是一個手寫數字數據庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本圖像的寬高為28*28。此數據集是以二進制存儲的,不能直接以圖像格式查看,不過很容易找到將其轉換成圖像格式的工具。
最早的深度卷積網絡LeNet便是針對此數據集的,當前主流深度學習框架幾乎無一例外將MNIST數據集的處理作為介紹及入門第一教程,其中Tensorflow關于MNIST的教程非常詳細。
2.Imagenet
?
MNIST將初學者領進了深度學習領域,而Imagenet數據集對深度學習的浪潮起了巨大的推動作用。深度學習領域大牛Hinton在2012年發表的論文《ImageNet Classification with Deep Convolutional Neural Networks》在計算機視覺領域帶來了一場“革命”,此論文的工作正是基于Imagenet數據集。
Imagenet數據集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標注和圖像中物體位置的標注,具體信息如下:
1)Total number of non-empty synsets: 21841
2)Total number of images: 14,197,122
3)Number of images with bounding box annotations: 1,034,908
4)Number of synsets with SIFT features: 1000
5)Number of images with SIFT features: 1.2 million
Imagenet數據集是目前深度學習圖像領域應用得非常多的一個領域,關于圖像分類、定位、檢測等研究工作大多基于此數據集展開。Imagenet數據集文檔詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習圖像領域算法性能檢驗的“標準”數據集。
3.COCO
?
COCO(Common Objects in Context)是一個新的圖像識別、分割和圖像語義數據集,它有如下特點:
1)Object segmentation
2)Recognition in Context
3)Multiple objects per image
4)More than 300,000 images
5)More than 2 Million instances
6)80 object categories
7)5 captions per image
8)Keypoints on 100,000 people
COCO數據集由微軟贊助,其對于圖像的標注信息不僅有類別、位置信息,還有對圖像的語義文本描述,COCO數據集的開源使得近兩三年來圖像分割語義理解取得了巨大的進展,也幾乎成為了圖像語義理解算法性能評價的“標準”數據集。
4.PASCAL VOC
?
PASCAL VOC挑戰賽是視覺對象的分類識別和檢測的一個基準測試,提供了檢測算法和學習性能的標準圖像注釋數據集和標準的評估系統。PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽在2012年后便不再舉辦,但其數據集圖像質量好,標注完備,非常適合用來測試算法性能。
?
5.CIFAR-10
CIFAR-10包含10個類別,50,000個訓練圖像,彩色圖像大小:32x32,10,000個測試圖像。CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用于訓練,100張用于測試;這100個類分組成20個超類。圖像類別均有明確標注。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規模數據集。
---------------------?
作者:遠方_boy?
來源:CSDN?
原文:https://blog.csdn.net/weixin_41683218/article/details/81191073?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!