2016-11-22 103 views
3

我有兩個關於如何加載Imagenet數據的問題。 我下載了ILSVRC2012驗證集(導致訓練集太大) 但我有兩個問題。如何查找Imagenet數據標籤?

  1. 我不明白我該如何找出標籤。 只有像「ILSVRC2012_val_00000001.JPEG」這樣的文件名的jpeg文件,但沒有標籤。我怎樣才能找到他們?

  2. 據我所知,Imagenet使用224 * 224像素的圖像,問題只是「分類」而不是「檢測」,但ILSVRC2012集具有更多和不同的像素大小。那麼,我怎樣才能獲得適合224 * 224像素的盒子呢?

+0

我沒有下載數據集,所以我不能回答第一部分,但肯定有一些文件可能表明類號。關於你的第二個問題,我讀到的大多數論文都表明他們選擇了他們的輸入是224。如果你可以擺脫FC層,甚至通過調整輸入大小或滑過你的輸入,擁有不同的圖像大小並不是問題 – Feras

+0

另請參閱:[我在哪裏可以獲得小型ImageNet的標籤?](http://datascience.stackexchange.com/q/13438/8820) –

+0

您可能能夠回答[如何獲取ImageNet ILSVRC 2012數據爲分類挑戰?](http://datascience.stackexchange.com/q/13864/8820) –

回答

0

請確保您從here下載和你與synsent數每個類別的文件夾中解壓縮每個文件的.tar。這是你不混合圖片的最佳方式。

0

它在開發工具包(任務1 & 2) 稱爲「ILSVRC2012_validation_ground_truth.txt」的文件名

1
  1. 你會下載三個tar檔案:一個用於訓練數據,一個用於驗證數據,和一個爲測試數據。培訓數據包含在1000個文件夾中,每個文件夾一個文件夾(每個文件夾應包含1300個JPEG圖像)。驗證數據是一個包含50k JPEG圖像的單個文件夾,查找相應的ILSVRC2012_validation_ground_truth.txt文件(如提到的darren1231,它需要作爲DevKit的一部分單獨下載)。 測試數據與驗證數據類似,但沒有標籤(標籤不會提供給您,因爲您需要向競爭對手提交預測標籤)。

  2. ImageNet圖像的可變分辨率平均爲482x415,它取決於您如何處理它們以訓練模型。大多數人將它處理如下:首先縮小每個圖像,使其較短的一面是256像素。然後裁剪一個隨機的224x224補丁。使用這些修補程序進行培訓(每個時代你都會得到不同的作物)。在測試過程中,請執行相同的操作,但需要提取中心224x224補丁,並將其用於評估分類準確性。有些人也使用多個補丁來進行測試。再次,這取決於你,如果你喜歡,你可以使用更高的分辨率。